音频质量主观评测
赛西与北京理工大学信息与电子学院通信技术研究所合作建立音频评测实验室。当前建设有符合ITU国际标准的音频评测实验室,从建立伊始便承接国内外标准组织ITU、3GPP、AVS及中国移动、爱立信、华为、小米等企事业单位的各类语音和音频质量主观测试任务,向标准组织提交测试报告,并为移动运营商和数字音频企业提供可靠的测试依据。该实验室成为承担国际语音技术评测工作的唯一中方高校,依托在主观测试方面的长期经验积累,为企业提供从测试实验设计、测试流程管理、测试材料录制、测试数据分析、音频技术选型等全面、专业的测试技术支持,目前已为多家客户提供主观评测服务并获得好评,可承接各类数字音频系统输出声音信号的主观质量评价实验,适用的技术领域包括语音处理、音频编码、数字音频存储、音频流媒体、语音即时通讯、音频娱乐体验等。
测试控制室 听音测试场景
听音环境示例 交谈测试场景
部分能力范围内的标准:
(1)ITU-T Rec.P.800《Methods for subjective determination of transmission quality》/ITU-T Rec.P.830《Subjective performance assessment of telephone-band and wideband digital codecs》:主要针对各类语音处理系统的输出声音质量进行主观评价,典型方法为MOS平均意见分测试。测试过程中选取大量的普通电话用户在标准听音环境下对经不同测试条件处理后的声音样本进行逐一或对比听音,按照规范的测试流程得到主观测试数据,并进行严格的数据统计分析。该标准可评估的测试样品包括窄带和宽带电话系统、移动语音和音频、语音编解码器、数字语音记录仪及其它语音和音频处理模块,测试项目主要包括绝对等级评价(ACR)、失真等级评价(DCR)、比较等级评价(CCR)三大类。单次32人次的听音测试项目周期为2-3周。
(2)ITU-T P.805《Subjective evaluation of conversational quality》:对话意见测试,能够提供更接近真实环境下双向交互通讯系统的话音质量评估。测试过程分组进行,每组由两名测试人员在独立的隔音室内通过传输设备保持对话,并在通话结束后对通话质量进行评分,可同时评价整个语音通信系统或由于某些具体因素(如丢包、延迟、回声、噪声)造成的通话损伤。该标准可评估的测试样品包括VoIP系统、电话会议系统、面向网络优化的语音编解码器及其它双向交互通讯系统。典型的单次对话测试实验规模为16组成对测试人员,一般项目周期为1-2个月。
(3)ITU-R Rec.BS.1534《Method for the subjective assessment of intermediate quality level of coding systems》:带隐藏参考和基准的多激励测试(MUSHRA),宜评估中等音频质量的数字音频系统。MUSHRA是一种双盲的多激励音频信号听音比较测试方法,测试者可以随意选择基准信号和其他测试信号,打分级别0-100,该方法需要选取有经验的听音人员首先进行测听训练,之后进行正式测试。该标准可评估的测试样品包括音频流媒体、广播音频信号、数字卫星服务,移动多媒体应用等。单次20人次的测试实验周期为3-4周。
(4)ITU-R BS.1116《Methods for the subjective assessment of small impairments in audio systems》:带隐藏参考的三次听音双盲听评法,宜评估小损伤的高质量音频系统。测试过程选取专业级别的听音人员,需经过严格的测试培训后进行正式测试,通过对比基准信号,对隐藏参考样本和待测样本进行评分。该标准主要用来评估高保真音频或高质量的广播音频,例如立体声和环绕声音频信号、多通道音频编码器及数字卫星广播伴音等,由于要求的测试精度较高,项目周期相对较长,根据测试条件数目。单次15人次的测试实验周期为1-2月。
(5)ITU-R BS.1285《Pre-Selection Methods for the Subjective Assessment of Small Impairments in Audio Systems》:用于预选测试的双向比较听评方法,宜作为BS1116小损伤音频系统主观测试的预选实验方法,例如在面向高质量音频应用场合,如果无法提前预估音频质量或实验规模过大,可以通过预选实验排除低质量测试条件,以免干扰高质量测试过程。该标准一般用于小损伤音频测试的预选,可节省测试时间,通过双向比较的评分方法,选取少量专业测试人员,利用耳机进行听评。单次15人次的测试实验周期为2-3周。