首页 > 娱乐前沿 > 科技
Google靠128维深度学习网络打造新版音乐搜寻,分辨超大量音乐也不会变慢
尤慧 2018-09-18 10:17:49

现在Android手机上的Google搜寻或是Google助理,内建了最新一代的音乐分辨功能,这源自2017年上线的Now△Playing功能,但采了4倍大的深度学习神经网络来训练,嵌入(Embedding△)的维度从96维成长到了128维,Google宣称,不影响分辨速度下,几乎无限制增加可分辨的音乐资料库数量。9kl我酷网

2017年Google在其Pixel△2上推出Now△Playing功能,这是基于深度学习神经网络的低功耗音乐分辨服务。Google在打造Now△Playing时,目标朝向满足小型且高效的诉求,资料库只需要存放非常小的音乐特征,可以让装置在没有网际网络连线的状态下,提供音乐分辨服务,而手机端Now△Playing应用的准确度和速度,超越了当时以伺服器端系统提供的声音搜寻(Sound△Search)服务。9kl我酷网

也因此,Google采用Now△Playing相同的技术,来打造新版声音搜寻功能,并内建到Android手机上,成为Google搜寻或是Google智慧助理的基本功能,只要使用者启用语音查询,声音搜寻服务会自动侦测背景的声音,当发现装置附近有音乐拨放,介面便会出现相关提问,引导使用者查询歌曲名称,使用者也可以直接使用Hey,Google指令查询。9kl我酷网

9kl我酷网

原本的Now△Playing功能系统非常小巧,用于手机上的搜寻,持续执行也不会明显影响电力。因为Now△Playing会将侦测到的音讯撷取8秒,使用卷积神经网络将数秒钟的音讯档案转成独特的指纹特征,投影到一个由7段2秒片段组成的低维度嵌入空间,再以此特征与手机上的定期更新的离线歌曲资料库进行比对。搜寻装置上的歌曲资料库,来分辨该资料库内的特征资料。系统会使用两阶段来搜寻歌曲,第一阶段使用快速但不精确的演算法,搜寻整个资料库以找出可能的候选歌曲,第二阶段再对候选者进行详细分析,进一步找出正确的歌曲。9kl我酷网

伺服器端的声音搜寻系统运作方式和Now△Playing大不相同,必须比对的资料库是Now△Playing规模的1千倍,这对搜寻的准确度和速度都是很大的挑战。虽然Google使用Now△Playing技术来改进伺服器端的声音搜寻,但是极大的歌曲资料库,让错误预测产生的机率上升。为了降低这些错误,Google必须要增加分辨閾值,而这代表着必须要增加比对音讯的长度。Google认为,新的服务应该要比旧的更快,使用超过10秒的音讯不符合期待。9kl我酷网

不过,由于声音搜寻服务建立在伺服器端,因此可以用不受限制的运算以及储存资源来弥补这些缺点。Google打造比原本还要大4倍的卷积神经网络,并且增加每一嵌入维度,从96维提高到了128维,减少了卷积神经网络将高维度音讯打包成低维嵌入所需要的工作量,这对于进行详细分析的第二阶段搜寻的品质至关重要。另外,Google还根据歌曲流行的程度,对索引进行加权,越流行的音乐设定越低的权重,并增加模糊朦胧的音乐权重,整体来说,比对资料库可以几乎没有限制的增加歌曲,且不会过度影响资料分辨的速度。9kl我酷网

Google仍继续提升分辨音乐的准度和速度,特别是在背景音的处理,因为使用者分辨音乐的环境可能很安静也可能很吵杂,这也都会直接影响分辨品质。9kl我酷网

9kl我酷网

上一篇  下一篇

I 相关 / Other

新版iphone保护套价格 [热事件]

新一代iPhone发布后,过万的售价让众多网友齐呼买不起,但没想到,目前在苹果官方商城,上架的新版iphone保护套价格更是惊人,售价来到了1099元,要知道,这可是入门级安卓机的价格了,下文就来带大家了解一下。新版

网络安全宣传周 [热事件]

在如今网络已经逐渐全面普及的年代,个人的网络财产安全是一件很重要的事情。近日,2018网络安全宣传周在天津市启动,会议提到要深入开展网络安全知识技能宣传普及,提高广大人民群众网络安全意识和防护技能,那么个

网络逃废债无处可逃 [热事件]

九月之前,网上很多网贷公司爆雷的消息,九月之后,爆雷的消息终于消停了些。对于网贷平台爆雷的原因,业内人士做了很多分析,最主要的原因是借款人恶意欠款不还,导致网贷平台逾期项目过多,从而无法正常提现,最终

Google Chrome 70 或支援人脸分辨、指纹认证登入网络服务 | 香港 UNWIRE.HK 玩生活.乐科技

现在我们用手机登入网站时,会使用到人脸分辨或指纹分辨系统确认身份,浏览器自动为你输入网上服务的登入资料。而日后这种安全登入方式或会普及在电脑平台上使用。Google Chrome 70 最新测试版就加入了人脸分辨 API、

微软买下用拖曳就建立深度学习模型的Lobe

微软在周四(9/13)宣布已买下2015年建立的新创公司Lobe,Lobe提供视觉化的介面,标榜可让缺乏程式或人工智能技术背景的一般人都能借由拖曳方式建立深度学习模型,还能快速训练这些模型并将它们输出至行动程式中。只

I 热点 / Hot