华为再添新技术:华为声纹识别技术加入华为科技大家庭,预在华为笔记本应用新技术

据悉,华为将在7月27日的新品发布会上推出新款笔记本MateBook X Pro,首次采用声纹识别技术。如果技术体验完美,将引发人机交互体验的新革命。

华为再添新技术:华为声纹识别技术加入华为科技大家庭,预在华为笔记本应用新技术 第2张

1.发展历史

声纹是指人的声音中所包含的语音特征,能够唯一识别用户的身份。声纹识别的技术就是根据不同说话人的身份来区分他们的声音。

“声纹”一词首次出现在1918年10月26日出版的《田纳西新闻》的一篇短文中。当时没有技术指标。

1935年2月1日,在匹兹堡的报刊上,首次介绍了侦探界开始使用声纹进行刑事调查的故事。根据描述,当时的侦探利用示波器记录的示波器来分辨不同人的声音,尤其是一个人的口音和国籍。

然而,专业科学文献中对声纹的研究发表在1962年的《美国声学学会杂志》上。在这篇题为“声纹识别”的文章中,作者提出了一种基于时间谱图像的方法。1966年,美国法院首次使用声纹收集证据。

华为再添新技术:华为声纹识别技术加入华为科技大家庭,预在华为笔记本应用新技术 第4张

为了规范和正确引导声纹识别的发展,我国已经出台了多项声纹识别标准。2008年,原信息产业部正式颁布实施《自动声纹识别(说话人识别)技术规范》,这是我国首个声纹识别行业标准。2010年12月2日,公安部颁布实施了《安全声纹确认应用算法技术要求和测试方法》。

2018年被称为声纹技术应用的“元年”。10月9日,中国人民银行正式发布金融行业标准《基于声纹识别的移动金融安全应用技术规范》,这是金融监管部门认可的首个生物识别标准,解决了声纹识别技术进入移动金融领域的标准问题。

此后,随着人工智能技术的进一步突破,声纹识别技术发展迅速。投宝研究院的研究报告显示,截至2022年5月,中国声纹识别技术相关专利申请2765件,其中2018年后专利申请量呈现快速增长趋势,主要分布在智能客服、移动支付、金融安全等业务场景。

2.技术进化

每个人的声音都有不同的特点,这使得通过不同的语音特征来区分用户成为可能。

声纹作为生物特征识别的一种,具有天然的“非接触”特性,具有隐私少、接受度高、成本低、不易伪造等优点。

从技术发展来看,声纹识别技术经历了三大阶段:基于模板匹配的声纹识别技术;基于统计机器学习的声纹识别技术:基于深度学习框架的声纹识别技术。

声纹识别最早的技术框架是非参数模型。基于信号比较的不同,通常要求注册的语音与待识别的语音相同,是文本相关的,因此具有很强的局限性。

受益于统计机器学习的快速发展,声纹识别技术也迎来了第二阶段。这个阶段又可以细分为四个小阶段,即GMM > GMM-UBM/GMM-SVM > JFA > GMM-我矢-PLDA。

随着深度神经网络技术的快速发展,声纹识别技术逐渐采用了基于深度神经网络的技术框架。目前有DNN-依维特-PLDA和最新的End-2 End。其中,

基于深度神经网络(DNN) (D-Vector)的方法:DNN可以从大量样本中学习高度抽象的音素特征,同时具有很强的抗噪声能力,可以消除噪声对声纹识别的干扰;

端到端深度神经网络(End-2-End):从神经网络中自动提取高级说话人特征并进行分类。

不难看出,声纹识别的研究趋势正在向深度学习和端到端快速发展,其中最典型的就是基于句子层面的实践。在网络结构设计、数据增强、损失函数设计等方面还有很多工作要做,还有很大的提升空间。

在利用深度学习和神经网络研究声纹识别技术之后,涌现出了很多重量级的公司和大学。美国的谷歌公司、约翰霍普金斯大学(JHU)、中国的百度公司和上海交通大学是这一领域的领导者。

3.市场需求

早上去公司,点开考勤APP说“早上好”完成打卡;下班回家对着智能门锁喊“开门”,门禁系统应答;手机银行办理业务时,按要求读取密码,实现安全登录和实名验证…

经过半个多世纪的探索和实践,声纹识别技术逐渐成熟,应用场景不断涌现。比如:

利用声纹确认技术,可以完成日常生活中各种事物的门禁授权,如智能手机锁屏、各种网络账号的声控密码锁、声控电脑锁、声控防盗门、声控车锁等。

利用声纹识别技术,可以支持智能音箱和智能语音助手提供个性化服务,比如根据兴趣推荐不同的歌曲和新闻,为家庭用户中的老人、小孩等不同年龄段的用户开放特定的功能和权限;

使用声纹检测和跟踪技术可以代替人工完成会议纪要。通过语音识别与声纹识别技术的结合,可以用语音识别技术识别会议记录的发言内容,用声纹识别技术标注每一段对应的发言人,轻松完成多人的会议纪要,大大提高工作效率。

中国声纹识别行业企业的发展可以分为三个阶段:第一批公司成立于2000年左右,如科大讯飞、捷通华声等,综合实力较强;第二批公司是2005年前后成立的深耕声纹识别技术的专业厂商,如德易通、厦门天聪等,技术能力过硬,是行业标准的制定者;第三批公司是2015年前后成立的AI创业公司,如快商通、国音智能等,发展迅速,R&D能力强。

投宝研究院预测,2026年中国声纹识别系统行业市场规模将达到49.76亿元,2021-2026年该行业年复合增长率将达到25.26%。

海报信息显示,华为首款声纹识别笔记本将于7月27日亮相。据业内预测,华为的声纹识别技术将用于笔记本解锁、支付、会议记录等场景。

以往每一代华为笔记本电脑都会带来开创性的功能,比如第一代产品的功能,比如一键传输和一键热点,第二代产品的功能,多屏协同,第三代产品的功能,比如软件市场。

这一次,华为Matebook X Pro对声纹识别技术的应用是否会在笔记本电脑领域带来全新的交互方式,还有待观察。

原文出处:声明:信息来源于原创或转载,转载此文是出于传递更多信息之目的。视点号尊重版权,请作者持权属证明与我们联系2889649679@qq.com,我们将及时更正、删除,谢谢!

(0)
上一篇 2022年 7月 26日 上午10:28
下一篇 2022年 7月 26日 下午12:06

相关推荐

发表回复

您的电子邮箱地址不会被公开。