全国咨询热线

13865997535

您现在所在位置:首页 > 新闻中心 > 公司新闻 > 正文

谷歌神经网络人声分离技术再突破

文章出处:人气:17发表时间:2018/10/14 20:17:16

谷歌和Idiap研究所的研究人员训练了两个独立的神经网络,能够显著降低多说话者信号的语音识别词错误率。

把一个人的声音从嘈杂的人群中分离出来是大多数人潜意识里都会做的事情——这就是所谓的鸡尾酒会效应。像谷歌Home和亚马逊的Echo这样的智能扬声器实现分离人群中的声音可能还要再经历一段时间,但多亏了AI,它们或许有一天能够像人类一样过滤掉声音。

谷歌和位于Switerzland的Idiap研究所的研究人员发表在Arxiv上的一篇论文中描述了一种新的解决方案。他们训练了两个独立的神经网络——说话者识别网络(a speaker recognition network)和声谱掩码网络(a spectrogram masking network)——这两个网络一起“显著”降低了多说话者信号的语音识别词错误率(WER)。

他们的工作建立在麻省理工学院计算机科学和人工智能实验室今年早些时候发表的一篇论文的基础上,该论文描述了一个名为PixelPlayer的系统,该系统能够将单个乐器的声音从YouTube视频中分离出来。


热销产品 了解更多+

合肥红绿蓝电子科技有限公司

地址:安徽省合肥市新站区淮海大道1188号京商商贸城F区商业HC132

电话:13865997535   13866734282

备案号:皖ICP备14022271号-1

扫一扫,加微信联系!

二维码1 二维码1 二维码2 二维码2

在线客服

二维码1
咨询热线 13865997535