评估空间音频-第3部分 | 创建一个可重复的系统来评估空间音频

来源:CEVA IP #CEVA# #评估空间音频# #Ceva#
7505

这是我们关于“空间音频评估”的深度探讨系列的第3部分。

《评估空间音频-第1部分 | 评估标准与挑战》中,我们探讨了“空间音频”产品系统的构成、面临的主要挑战、评估方法的客观与主观差异,以及需要关注的一些关键空间化参数。我们的系列文章第2部分则重点讨论了创建和策划用于评估空间音频的内容,特别是测试目的的内容。  

目前,对于空间音频的定义、范围以及如何有效量化“优质”空间音频体验,人们似乎存在很多混淆和不解。因此,目前行业内似乎缺乏一个统一的标准框架来评估空间音频体验。为此,Ceva正在着手开发这样一个框架,旨在以系统化和可重复的方式评估空间音频,希望提供一份指南,帮助任何人评估空间音频解决方案的有效性。  

我们首先将研究范围聚焦于安卓手机及其真无线立体声(TWS)蓝牙耳机,收集了几种不同的选择以进行比较。在明确了要测试的参数后,我们对这些选项进行了深入的竞争分析。在这篇博文中,我们将介绍所采用的方法论、使用的内容,以及如何关注并辨别音频在不同参数下的差异。 

竞争分析 

根据我们在第2部分中整合和讨论的多种内容,我们开始对各种平台进行竞争分析,列出了一系列有关空间音频体验的问题。在分析时,我们努力涵盖所有可能影响空间音频体验的方面,并汇总了一系列参数,使得我们能够系统地、重复地评估这些不同的产品系统。  

由于空间音频的本质是主观的,取决于每个人独特的生理特征和感知能力,所以,我们测试的各个参数可能是主观的(感知),也可能是客观的(测量),或两者兼而有之。  

我们把所有这些问题整理成一个可以重复使用的模板,确定所需参数,每个产品都可以重复使用。接下来,我们花了相当多的时间在每个产品上,认真且批判性地聆听,以回答所有这些问题,同时在我们的模板中做记录。   

请记住,耳朵疲劳是一个必须面对的现实问题。持续聆听噪声和响亮声音可能会让人失去判断力,而在最初的几分钟内所获得的反馈和观察往往是最有价值的。因此,我们建议在进行这种评估时,适时休息。 

根据我们所聆听的所有特征和参数,我们最终得出两大类参数:空间化和头部跟踪。这两个类别很好地概括了空间音频体验,所有主观、客观和组合参数都属于这两个类别中的任何一类。让我们深入了解这两个类别。 

空间化

与声音的空间效果感知相关的所有参数都属于这一类别。

外部化程度

在讨论外部化程度时,最重要的问题是:音频听起来离头部有多远。测试音频外部化程度的一个有效方法是,播放一个粉红噪声的音频片段,如果是5.1、7.1或7.1.4格式的音频,可以选择把噪声隔离到前左声道;如果是立体声片段,就选择左声道。  

在开启和关闭空间音频效果时,您会注意到声音的感知位置变化,当您关闭空间音频效果时,应该能感觉到声音变得非常近,似乎是直接在您左耳内部产生的。然后再次打开空间音效,闭上眼睛,注意听声音的位置变化。通过这种方法,您可以有效地感知声音被空间化后的效果,指向虚拟房间中左侧或前左侧的扬声器位置。当然,这一体验具有很大的主观性,但通常能够感受到声音的外部化。  

在不同的产品系统中,我们感受到声音的外部化程度从离头部约2.5厘米到15厘米不等,最多约30厘米外。  

另外,还值得检查这种外部化程度在所有方向上是否一致。在大多数产品中,外部化的确切程度会因方向而异。在7.1设置中,前排左侧和后环绕左侧的声音可能比侧环绕左侧更远,而侧左又可能比正前方的中置声道感觉更远。值得提醒的是,即便在自然环境中,转动头部也是准确定位周围声音的关键。因此,头部跟踪在空间音频解决方案中大有作为,因为即使是微小的头部移动,只要进行跟踪,也能帮助我们解决前后混淆等问题,从而准确定位声音。  

房间特性/预设

回过头来再看前面我们讨论的在不同房间中鼓掌的例子,这个例子关注的是虚拟房间的音质特征及其混响效果。房间特性本身是一个主观参数。为了更好地聆听这个参数,瞬态声音(如低音鼓、军鼓或拍手的样本)是理想的选择。有时,简短的踩镲节奏循环也非常有用,因为镲的音色往往非常像噪音,包含大量高频信息,这能揭示很多关于音色和音调的细节,同时它们的声音大多是快速且瞬态的。 

使用能够设置为“单曲循环”模式的播放器,这样它会在播放选定文件后重复循环该文件。仔细聆听瞬态声音的衰减,这将让您对这个房间的感觉有一个清晰的了解。如果声音持续一段时间,您会觉得它是在一个更具反射性和活力的房间里播放。如果您能清晰地听到瞬时声音的早期反射,即声音发出后马上有回声,那可能会让您感觉这个房间比较小;相反,在较大的房间中,早期反射会显得更柔和,听起来不那么尖锐。 

在做此类测试时,并没有“理想”的解决方案或房间特性。您的实际体验会因个人喜好而异。值得查看产品是否有不同的房间类型预设选项。产品通常会提供几种音效选择,例如录音室、音乐厅、大教堂等。当然了,这是一个客观参数。 

最大渲染声道数

这个参数相当简单。如果您播放一个包含12个音频声道的7.1.4音频片段,所有12个声道能否在其正确位置被渲染?如果可以,您应该会得到12个虚拟扬声器的位置——7个在您周围的水平面上,一个声道用于低频效果,另外四个在您头顶上。如果不是7.1.4配置呢,7.1也可以正确渲染吗?如果不是7.1配置呢,5.1也可以正确渲染吗? 

在内容策划阶段,我们还创建了另一组声道识别文件。我们取一段一个人说话的单声道录音,然后依次命名各种声道——“这是前排左侧声道”,“这是侧环绕右侧”,“这是前排右上方”等等。我们将这些单声道录音剪辑整合在一起,使每个录音都对应到其相应的声道,并按顺序一个接一个地播放。最后,我们导出一个单一的7.1.4 WAV文件。我们最终得到了一个长约30到45秒的12声道声道识别文件,其中逐个命名了不同的声道。在合适的播放系统上正确渲染时,文件的内容会按照每个声道的顺序播放,听众能够清楚地听到每个声道所代表的具体位置。  

我们重复了这一过程,分别创建了7.1和5.1设置下的声道识别文件。  这也是一个客观参数。播放系统能否正确渲染多声道内容?如果可以,最多可以渲染多少个声道?有些系统可以处理12个,有些可以处理8个,有些可以处理6个,还有些根本无法渲染多声道内容,只能渲染立体声。  

单声道与立体声渲染

并非所有我们测试的播放系统都能对单声道(一个声道)或立体声(两个声道)内容进行空间化处理。例如,截至目前,一些流行平台上的音乐仅为立体声。当空间化效果启用时,声音的空间感是否得到了提升,感觉像是来自您头外左右两侧的两个虚拟扬声器,而不是直接来源于您左右耳?  

这同样是一个客观参数。有些播放系统无法对单声道或立体声内容进行空间化,只能对多声道内容(5.1及以上)进行空间化。

瑕疵

这是一个相当直观的组合参数,既包括主观因素,也包括客观因素,涵盖了任何问题、失真、瑕疵和不一致等等。  

一些观察到的瑕疵可能表现为声音在声场的某个位置失真,或虚拟扬声器的位置不正确,例如,后环绕左侧声道的声音可能听起来像是直接在您身后,而不是在预期的左后方。测试这种情况的最佳方法是聆听大量音频文件,尤其是那些可以将声音隔离到不同声道的文件,这样您就能轻松地单独关注每个声音。

头部跟踪

所有与头部跟踪有关的参数,以及这些参数如何影响空间音频体验,都属于这一类别。我们之前曾撰文介绍头部跟踪如何提升空间音频体验,阐明了头部追踪在增强空间音频沉浸感方面的重要性。 

延迟

头部跟踪延迟是指从头部移动发生变化到声音音色或定位反映出这一变化之间的时间延迟。  

这个因素对体验有着非常显著的影响。如果您在播放声音时突然将头转向左侧90度,但听到音频反应时有明显的延迟,这会大大影响您的空间音频体验。像这样突然的头部移动通常是测试延迟的好方法。  

需要注意的是,许多系统还使用一定程度的头部跟踪预测,这能在一定程度上补偿延迟,并提供更流畅的体验。 

目前各大公司正在进行大量研究,以确定普通听众可接受的延迟时间。虽然意见各异,但我们发现大约70毫秒的有效延迟(在预测之后)是一个不错的目标。当然,每个人的感知能力不同,但我们发现,当延迟值高于这个范围时,听众更可能感知到延迟并受到干扰。  

产品系统的原始头部跟踪延迟显然是一个客观值,测量起来相对困难。我们开发了一个基于云台和假头的系统来尝试客观测量这个值。然而,考虑到前面提到的头部跟踪预测,这个参数的测量就不那么精确了。 

自由度

系统跟踪头部运动的自由度有多少?  我们通常会看这三个自由度——偏航、俯仰和滚转。 

▲头部的偏航、俯仰和滚转运动 

这是一个客观参数。一些系统只跟踪头部的偏航运动,而其他系统则能够同时跟踪偏航、俯仰和滚转。此外,还有重定中心的问题。即使系统可以追踪偏航、俯仰和滚转,它是只对偏航的变化进行重定中心,还是对所有三个变化都进行重定中心? 

测试这方面的一个好方法是播放仅在单一声道中隔离的粉噪音,并尝试以各种方式转动和旋转头部。以下是一些示例:

i.保持声音隔离在中置声道,这样声音就在您面前。将头向左、向右和向后转动。声音是否保持在原位而不移动?还可以尝试上下看,并左右转动头部(面向前方,转动头部,使左耳几乎触及左肩,右耳触及右肩)。 

保持声音隔离在侧环绕右侧声道(在7.1或7.1.4配置中),使声音正好在您右侧。将头向右转90度。感觉是否像是正面朝向声音源?如果将头向左转90度,声音是否感觉现在在您身后?如果上下摇头,声音是否仍然保持在右侧?如果向左和向右滚动头部,声音又会有什么变化?

瑕疵

这也是一个非常直观的类别,既有客观因素,也有主观因素。 

头部跟踪是否流畅?在某些动作中,头部跟踪是否会导致音频出现跳跃或其他异常,例如失真?如果您播放一个位于您正前方的声音,并进行360度旋转,这个声音是否仍然保持在中心?随着时间推移,声音场是否会向某个方向漂移?  这些都是需要关注并聆听的头部跟踪异常现象的例子。  

结论

空间音频本质上是一种主观体验。尽管如此,我们在空间音频的应用上仅仅触及了表面。尤其是在系统中加入头部跟踪后,空间音频产品系统有能力让我们身临其境的享受内容,达到高度沉浸的体验。这项技术有潜力带给您不同的感受:观看一场高能的动作场景时,不再只是被动地接受,而是仿佛置身于场景之中;或者说,从单纯欣赏您最爱的乐队演出,变成感觉自己就在舞台上与他们同台演出。  

这是一个激动人心的时代,空间音频技术在不断突破!然而,和所有新技术一样,帮助人们了解这项技术的基本原理,以及他们可以期待什么和应该注意哪些方面,也同样重要。  

换句话说,除了推广技术本身,教育用户如何正确使用和体验这种新技术也是至关重要的。随着这项技术不断发展和演进,我们将继续扩展、完善并优化这一框架。我们鼓励整个行业共同参与,携手开发新的方法、测试,以及定量和定性指标,以更好地总结、评估空间音频体验。  

责编: 爱集微
来源:CEVA IP #CEVA# #评估空间音频# #Ceva#
THE END
关闭
加载

PDF 加载中...