语音识别
语音识别生物识别模式是生理模式和Behave模式的结合。语音识别只不过是声音识别。它依赖于受以下因素影响的功能 -
生理成分- 人的声带、嘴唇、牙齿、舌头和口腔的物理形状、大小和健康状况。
Behave成分- 说话时人的情绪状态、口音、语气、音高、说话速度、咕哝等。
语音识别系统
语音识别也称为说话人识别。注册时,用户需要对着麦克风说出单词或短语。这是获取候选人的语音样本所必需的。
来自麦克风的电信号由模数 (ADC) 转换器转换为数字信号。它作为数字化样本记录到计算机内存中。然后,计算机将候选人的输入语音与存储的数字化语音样本进行比较并尝试匹配,并识别该候选人。
语音识别方式
语音识别有两种变体——说话者相关和说话者无关。
与说话人相关的语音识别依赖于对候选人特定语音特征的了解。该系统通过语音训练(或注册)来学习这些特征。
在使用该系统来识别所说内容之前,需要对用户进行培训,使其适应特定的口音和语气。
如果只有一个用户要使用该系统,这是一个不错的选择。
与说话人无关的系统能够通过限制语音的上下文(例如单词和短语)来识别来自不同用户的语音。这些系统用于自动电话接口。
他们不需要对每个用户进行系统培训。
如果不需要识别每个候选人的语音特征,那么它们是供不同个人使用的不错选择。
语音和语音识别之间的区别
误认为说话人识别与语音识别相同;但它们是不同的技术。让我们看看如何 -
说话人识别(语音识别) | 语音识别 |
---|---|
语音识别的目标是识别谁在说话。 | 语音识别旨在理解和理解所说的内容。 |
它用于通过分析语气、音调和口音来识别一个人。 | 它用于免提计算、地图或菜单导航。 |
语音识别的优点
- 它很容易实现。
语音识别的缺点
- 它容易受到麦克风质量和噪音的影响。
无法控制影响输入系统的因素会显着降低性能。
一些说话人验证系统还容易受到录制语音的欺骗攻击。
语音识别的应用
- 进行电话和互联网交易。
使用基于交互式语音应答 (IRV) 的银行和医疗系统。
- 对数字文档应用音频签名。
- 娱乐和紧急服务。
- 在在线教育系统中。