语音分析的定义

2025-03-21 12:05:44
推荐回答(1个)
回答1:

语音分析(SpeechAnalytics)技术,是指通过语音识别等核心技术将非结构化的语音信息转换为结构化的索引,实现对海量录音文件、音频文件的的知识挖掘和快速检索。
呼叫中心保存着大量的客服录音数据,这些语音中包含着客户需求、投诉、满意度、建议、竞争性情报等大量的有价值的信息,但是由于数量巨大,检索不便,目前普遍只能用于质检。
科大讯飞VoiceInsight语音分析系统,通过领先的语音分析核心技术,针对客服中心的实际业务需要,可有效的对录音数据进行自动分析,提取出有效的信息,让用户驾驭海量客服录音数据,辅助客服质检,进而针对性的改善客服质量,提高客户满意度;同时也可以通过系统挖掘到用户行为数据,进而及时进行准确的市场决策。
语音分析常用的特有参数有:共振峰幅度与频率,它是语音短时功率谱中能量集中的几个区域,区域中心频率称为共振峰频率,一般语音有三至五个共振峰。这些共振峰频率成分的幅度称为共振峰幅度。有时把共振峰幅度从中心到下降3dB处的带宽称为共振峰带宽。共振峰的参数完全确定了发音中元音的属性。
用时域方法,采用线性预测计算方法获得的语音参数,称为线性预测参数。线性预测参数是语音的时域分析参数,它能准确地获得声道的传输特性,由时域与频域参数之间的确定关系,由线性预测参数可转换求得共振峰参数。利用线性预测参数可以求得另一组参数称为反射系数,反射系数比线性预测参数具有更好的数值稳定性。由线性预测参数还可以求得另外一套系数,称为线谱对参数,它们既保留时域计算的特点,又具有反映共振峰频率特性的内涵。
利用同态信号分析方法,对语音信号进行分析可以得到一组倒谱参数。倒谱参数被认为是更适用于语音识别的一组参数。
语音分析技术常被用于语音编码压缩,形成各种中速、低速编码的新方案。例如子带编码、交换编码、自适应预测编码、多脉冲激励线性预测编码、码激励线性预测编码等。语音识别也是基于语音分析的结果,进行参数的分类与识别,运用不同的参数,可以导致不同的识别结果。利用语音分析技术还可以设计制造用于发音的各种矫正仪器,可供发音器官疾病的治疗或聋哑人发音训练等使用。
语音分析的常用仪器有语图仪,用于语音动态频谱的分析及记录。实时数字语图仪是一种新的语图仪。语音分析更常用的方法是利用通用微机加入语音处理设置,通过专用软件计算获得。