百度贾磊:百度大脑语音实现突破,深度学习助力语音识别打破领域壁垒

  • 时间:
  • 浏览:0
  • 来源:彩神大发快三

2019年12月26日,由百度与ZOL联手举办的“智见未来”峰会——暨2019年度“星标大奖”颁奖盛典在北京举行。在盛典上百度语音首席架构师贾磊发表了主旨为“百度大脑语音技术的前沿进展”的演讲,从百度语音产品矩阵、百度智能语音除理方案、百度智能语音交互系统这三方面全方位介绍了百度智能语音交互系统全景。



百度语音首席架构师贾磊

贾磊指出,面对未来智能语音产业链的新需求,百度将研发新一代的端到端智能语音交互系统,实现语音交互全链路协同除理。

百度创新提出复数CNN网络的语音增强和声学建模一体化方案

贾磊在演讲中提到,传统的远场语音交互系统中,是先采用有有四个多基于麦克阵列的语音增强模块,事先 再接有有四个多语音识别模块,有有四个多模块串联连接。你這個系统设计最好的辦法 具有好多好多 先天局限性。为了更好的智能远场语音交互体验,大伙儿儿儿不到设计一套全新的深层学习模型。“可能性能设计這個全新架构,一套模型,从原始多路声音信号现在结束,对识别文字直接端到端建模,从而使得远场识别性能大幅度的提升。后能 唤醒后,3500度随意的识别,而且不让要求设备音频回路不到是线性”,贾磊说。

而这假如百度推出“基于复数CNN网络的语音增强和声学建模一体化的端到端语音识别”方案的初衷。其最大特点假如颠覆了数字信号除理学科和语音识别学科的传统经典理论,直接一套模型端到端的打通有有四个多学科,完正数据驱动,端到端建模“,贾磊说。

具体来讲是,该模型底部以复数CNN为核心,利用复数CNN网络挖掘生理信号特点。采用复数CNN,复数全连接层以及CNN等多层网络,直接对原始的多通道语音信号进行多尺度多层次的信息抽取,期间充分挖掘频带之间的关联耦合信息。

在保留原始价值形式相位信息的前提下,你這個模型一次性实现了前端声源定位、波束形成和增强价值形式提取等功能。该模型底部CNN抽象出来的价值形式,直接送入端到端的流式多级的截断注意力模型(SMLTA)中,从而实现了从原始多路麦克信号到识别目标文字的端到端一体化建模。



百度贾磊:百度大脑语音实现突破,深层学习助力语音识别打破领域壁垒

可能性整个网络的优化准则完正依赖于语音识别网络的优化准则来做,完正以识别率提升为目标来做模型参数调优。而由此带来的好处假如言而喻。根据统计数据显示,相较于传统基于数字信号除理的麦克阵列算法,基于复数CNN网络的语音增强和声学建模使得错误率降低超过500%。

贾磊说:“大伙儿儿儿基于以上你這個技术,对于语音交互上将有更大的提升,而你這個提升和进步是颠覆性的。另外深层学习完成了数据革命和计算革命事先 ,现在结束进行跨学科整合,继续获得生命力和提升”。

另外从“复数CNN网络的语音增强和声学建模一体化方案”来看,深层学习在完成数据革命和计算革命事先 ,现在结束进行跨学科的整合,打破学科间的壁垒,有有四个多学科联合在同时继续获得生命力提升,这是百度语音技术提升的轨迹,贾磊指出。

SMLTA+全双工免唤醒拓展百度多语音识别能力

百度提出流式多级的截断注意力模型SMLTA,在国际上首次实现流式注意力建模超越整句注意力模型的性能,也是国际上首次实现在线语音识别大规模使用注意力模型。SMLTA 在大幅提升识别深层的同时,也提高了识别准确率。输入法有效产品相对准确率提升15%,音箱有效产品相对准确率提升20%。

基于此百度在对话能力迎来重大技术革新——全球领先的全双工免唤醒能力,实现了“一次唤醒,多轮交互”免唤醒词连续对话。

基于以上技术,百度提出了语音语义一体化除理方案,即百度后能 做到一套模型同时识别中文英文和方言。如在2019年1月百度输入法上线河南、山东、四川、东北、陕西、安徽方言的无障碍输入,今年年底将支持河北、山西、湖北、湖南、云南等。另外,值得一提的是,百度输入法还是支持中英文混合语音输入,而且识别率大幅度改进提升。

除了在应用和技术上的突破创新,贾磊还带来了百度大脑语音技术的前沿进展:百度2018年和2019年先后推出“百度昆仑”“百度鸿鹄”两款人工智能专用芯片,让智能时代的核心硬件技术自主可控。经过不断优化发展迭代升级,基于鸿鹄语音芯片已逐渐现在结束覆盖智能家居、智能车联、智能IoT的三大场景除理方案。

贾磊说,“2018年和2019年先后推出“百度昆仑”“百度鸿鹄”两款人工智能专用芯片,让智能时代的核心硬件技术自主可控”。

主题演讲最后,贾磊表示:希望通过语音技术和硬件芯片,为各大厂商为中国社会做更好地服务。

写在最后

当前以 AI 技术为核心的第四次工业革命可能性拉开大幕。怪怪的是随着5G商用事先 ,AI技术的落地正在加速,同时也是 AI 渗透到社会生活方方面面的现在结束。

这里百度凭借自身AI核心技术上取得诸多突破和储备,以及积极打造AI开放生态这两大优势,正确立在AI 技术革命中的行业领先地位。

本文属于原创文章,如若转载,请注明来源:百度贾磊:百度大脑语音实现突破,深层学习助力语音识别打破领域壁垒http://news.zol.com.cn/735/7355989.html

news.zol.com.cn true http://news.zol.com.cn/735/7355989.html report 3731 2019年12月26日,由百度与ZOL联手举办的“智见未来”峰会——暨2019年度“星标大奖”颁奖盛典在北京举行。在盛典上百度语音首席架构师贾磊发表了主旨为“百度大脑语音技术的前沿进展”的演讲,从百度语音产品矩阵、百度智能语音除理方案、百度智能语音交互系统这三方面全...