当前位置:首页 > 语音识别 > 正文

为什么语音识别都做不好

为什么准确的语音识别这么难?当前语音识别面临的挑战有哪些?分享者:谢磊老师(西北工业大学音频语音与语言处理研究组(ASLP@NPU)负责人) 助力AI语音开发者的社区,公众号:语音之家,AI语音人学习中心:https://根本原因在于,人类的语言实在是太过多样化了,即使是一个国家里的人,不同地区也流行着不同的方言。即使是一个地方的人,不同村庄的方言口音还不同。人类的语言库对于语音识别技术来说就是一个海量的学习库,其背后的机器学习目前还无法学习所有的语言,这对那些说话带着严重口音的人来说就不是那么友好了。

语音识别的准确率明显下降。此外,语音的训练和测试用数据的匹配也并不十分契合。想要解决环境复杂的问题,除了高超的技术之外,声学模型自适应等也但有时候部分车主会发现语音识别效果并没有达到预期状态,感觉爱车无法准确理解我们的唤醒需求,这是为什么呢?小编总结了一些在使用语音识别功能中遇

1. 本身音频内容靠正常的人耳听不清楚或者听不懂,这类情况建议对于前端的采音环境进行改造,如采音距离由远场改为近场,采音环境的噪音尽量控制和减少,口音、方言尽量控制在带口音的普通话(即非本地人可听懂)以及改善语速过快造成的吞音。2. 本身音频内容可以听懂,但识别结果与听到的内容相差很大。这类情况一般是音频信息不满足语音识别服务要求导致的。通过cooledit、Adobe Audition 或