- 经验
- 127
- 分贝
- 0
- 家园分
- 200
- 在线时间:
- 48 小时
- 最后登录:
- 2013-11-24
- 帖子:
- 34
- 精华:
- 0
- 注册时间:
- 2009-9-20
- UID:
- 437687
注册:2009-9-20
|
发表于 2012-7-11 20:52:24
|显示全部楼层
常用的MOS分评价方法包括主观MOS分评价和客观MOS分评价。
主观MOS分采用ITU-T P.800和P.830建议书,由不同的人分别对原始语料和经过系统处理后有衰退的语料进行主观感觉对比,得出MOS分,最后求平均值。
而客观MOS评价则采用ITU-T P.862建议书提供的PESQ方法,由专门的仪器(如Agilent的VQT测试仪)或App进行测试。
在MOS方法中,0分代表最差的质量,5分为最高分。标准PCM的质量约为4.4分。
常见编码格式对应MOS值如下:
G.711——MOS= 4.8
G.721、G.723、G.726——MOS= 4.2
G.728 ——MOS=4.2
G.729 ——MOS=4.2
G.723.1(5.3)——MOS=3.5
G.723.1(6.3)——MOS=3.98
主观MOS分ITU-T P.830对主观评定方法MOS(Mean Opinion Score)做了详细建议:特定的发音者与听音者在特定的环境下,通过收集测试者在各种不同情景下的主观感受,根据P.830的分析法则得出该语音的品质。P.830对测试的要求非常严格,所有的操作都要严格地服从操作流程,对录音系统、语音采样、语音输入级别、听者级别、不同发话者(8男、8女、8儿童)、多发话者(多人同时讲话)、差错处理、不同语音编码方式的兼容性、过失、环境噪音、音乐等等,都做出了详细严格的规定。
客观MOS分
就插入式(Intrusive)测试而言,当前业界已商用的、已标准化的算法中,以ITU-T P.862标准定义的PESQ算法为最优。
ITU-T相关的资料已证明PESQ是能够给出精确的预测值的,包括以下编解码和误码失真,波形编码(如G.711,G.726),CELP/高于4kbit/s的混合编解码(如G.728),移动编解码/系统(包括GSM FR、EFR、HR、AMR、CDMA EVRC、TDMA ACELP、VSELP和TETRA);各种编解码的代码转换,随机的、突发的、包丢失误差。PESQ能够用于编解码或系统评估、选择和优化。
为了训练PESQ,要在三个平均阶段通过使用很多的p值计算很大数量的不同的对称和非对称的参数。先使用参数的线性组合来预测主观MOS分,进一步对每次主观测试进行回归分析说明、解决不同的题目的前后关系和选择的偏好,如第3部分中所讨论的;这一步还用到了线性映射。对所有的候选参数集都进行了选择。这样找到了最优的组合,能给出最好的平均相关系数。这样可以在几百个候选参数中找到最好的。
举例来说,PESQ中用到部分补偿,在增益调制的均衡中,就要避免使用大量的参数来预测质量。只用到两个参数的组合— 一个对称干扰(dSYM)和一个非对称干扰(dASYM),在预测精度和概括能力上有很好的平衡。然而,由于低维数的模型依靠早先的阶段组合出复杂的感知作用,要求有几个迭代设计。听觉变换中的系数和干扰处理经过优化,找到了最优的参数,然后重复处理过程。下面给出PESQ中映射的分:
PESQMOS=4.5-0.1 dSYM-0.0309 dASYM
对于正规的主观测试,得分在1.0和4.5之间。在失真情况严重时,得分可能会低于1.0,但这种情况很少见。
|
|