当前位置: 首页 > 技术资料 > 扩大立体音场 空间音讯技术创造听觉新体验

扩大立体音场 空间音讯技术创造听觉新体验

QooIC.com 新闻出处:新电子 | 发布时间:2014/9/18 18:06:39

可携式装置的小型立体声音响系统由于音场(Soundstage)小,听者只能感受到近似单声道音响的效果;制造商可利用空间音效生成技术来扩大立体声音场,并加强串音消除(Crosstalk Cancellation),以克服此一设计障碍。

立体声音响系统的音场(Soundstage)通常受限于扬声器摆放位置,使得听者感受的声音事件(Sound Event)受限于两座扬声器间的范围;若是可携式装置的小型立体声扩音系统,则听者感受的立体声音场将更加有限,几乎近似单声道。

可携式立体声系统由于扬声器数量与形成的空间有限,连带使音场也受限;为克服尺寸障碍,可利用空间音效生成技术来扩大立体声音场、加强串音消除(Crosstalk Cancellation)并加强特定空间特质。

本文先定义空间音讯与介绍重要技术,例如头部相关传输函数(Head Related Transfer Function, HRTF)、串音消除、音讯波束成形(Audio Beamforming);接着则讨论波束成形技术与网路软体工具,只需几项简易步骤,即可创造音讯效果编程,将产品原本受限的音场改造成身历其境的剧场式体验。

重制声音 空间音讯改变听者判断

自然中出现的各种声音,本来即具备空间效果。音源通常为整体空间里某一小区块,但如地震、山崩等音源便是来自较大区域。

声音在各种物体间反射后,人们透过双耳接收直接或反射传来的声音,再经过听觉处理,才真正听到声音;同时可依据经处理后的声音做出各种判断,如方向、位置、音量、气氛、音质、远近、音调、厚薄等。即使是复数音源,人类听觉也能判断个别音源(相对于接收到的整体音效)的特征组合。

空间音讯意指透过电子或机械方式重制声音,并以人工方式重现,或是以人为途径改变重制声音,创造出原本可能不存在的感知空间环境。

脑部处理抵达双耳的声音,是判断声音各种特质的最终依据。若抵达双耳鼓膜的重制声波,与位于特定位置的实际音源所发出声音完全相同,即使音源在其他位置,听者仍会认定重制声音来自该特定位置。

头部相关传输函数因人而异

HRTF是耳部的频率反应函数,关乎人类如何接收与处理某一点传来的声音,同时说明了听觉讯号透过人体传递的过程,经由耳廓与耳道过滤,才抵达鼓膜。耳廓呈弧形对称,是造型特殊的,当过滤抵达鼓膜的声音时,会受地点与频率左右,在高频率时尤其明显。

HRTF基本上是以傅立叶转换(Fourier Transform),静态衡量左右耳接收到不同距离与方向的声音刺激后所反应之结果。两耳音量差(ILD)与两耳时间差(ITD),是依每只耳朵听到的声音而定(图1)。

  图1 由于两耳位置不同,声波进入每个耳朵的时间与强度也有所不同,头部相关传输函数便藉此判断音源所在位置。

每个人的听力与生理特质不同,因此HRTF也不同,但有些HRTF量测资料库仍采广泛分类,如男女老幼等,此数据经常用在需要HRTF的音响产品。HRTF量测过程相当耗时,考量人类头部无法长时间固定不动,导致资料不够精确,因此有些资料库在量测时使用假人,避免头部位移出错。

人耳能以3D(前后、上下、左右)判断声音方位,误差角度大约三度,亦可估算距离,这是因为脑部、内耳与外耳能运用单耳线索(Monaural Cue),同时对比双耳线索(Difference Cue或Binaural Cue)。在自然环境下,每个人均可透过不断尝试并从错误中累积,再加上生活经验,学习准确判定声音位置,弥补体型与构造所造成的差异。

若在既有音讯讯号上运用适当滤波器,并结合HRTF资讯,即可能合成出专为左右耳设计不同通道的双耳声(Binaural Sound),彷佛源自听者周遭空间的某一点,就像戴耳机时会体验到左右两侧声音有别,左右耳会各自接收到不同声音;相较之下,耳机传来的立体声讯号则彷佛从两耳之间的区域发出。所谓“3D音效”或“虚拟环绕音效”等名词,就是源于一般立体声与空间音讯之间的差异。

音讯串音干扰听觉品质

若使用离听者稍有距离的两部喇叭,由于双耳都会听到来自不同通道的声效,造成音讯串音,故较难以创造特定空间音讯效果;但若运用破坏波干扰来抵销不必要的讯号,即可消除串音。

例如,当反波(Antiwave)或消除波(Cancellation Wave)送进右耳,抵销不需要的左通道讯号;同样方式也可用来处理不需要的左耳通道讯号,如此将明确形成左右通道音效强化区,提升立体空间内的音效感受(图2)。

  图2 串音消除技术运用破坏波干扰来排除不必要的讯号。

各个通道内必须增加音讯处理,才能排除或减少串音效应,同时考量种种因素对声音可能的影响,包括听者位置(与扬声器的角度及距离)、耳朵听力与形状(受年龄、性别、族裔左右)、头部/身体尺寸及质量,还有现场实际环境(是否存在反射或吸音材质)。这些因素都将决定,听者是否能正确判别声音来源位置,故喇叭系统的空间音讯技术也得包括听觉波束成形。

波束成形塑造不同声波组合

在喇叭音讯重制过程中,“听觉波束成形”代表将声波导引至特定方向,而非遵循喇叭传统放射模式。

喇叭理想上应安置于无限大的反射板内,如活塞般运作;放射模式取决于喇叭辐条的相对频率;听觉波束的强度则取决于扬声器活塞半径相对于声音波长的比例。低频率时,喇叭声音会平均向前端各方发散,因此重低音喇叭无论放置于房间哪个位置,于房中听到的效果均会一致。

随频率增加,放射模式将愈趋集中于扬声器前方,形成狭窄的圆锥体,使轴心与喇叭表面垂直;声压度在圆锥体内达最强,离开范围后迅速下滑,当使用高传真(Hi-Fi)喇叭聆听高音频声音时左右移动,即可体验这种效果。

此外,喇叭实际上安装于相对小型的盒子内,而非无限大的反射板中,因此盒子边缘会导致音波衍射,使放射模式更加复杂。若扬声器位于户外,只有站在扬声器前方的圆锥体放射模式范围内,才可能听到所有重制频率。若喇叭置于房间内,由于声音在墙面及家具之间来回折射,聆听位置造成的影响不大。

虽然反射让声音在房内任何位置均可传达,但反射抵达的时间及强度与原有讯号不同,导致声音将变得模糊。因单一扬声器非常难以形成听觉波束,故一般使用两具以上扬声器,运用多重扬声器可产生各种建设性与破坏性的声波能量组合,以形成特定传播模式(图3)。

  图3 扬声器阵列波束成形时,声波会对空间内特定地点进行建设性干扰。

一般而言,空间效果在高频情况较容易达成与辨别,但若有大型扬声器阵列与理想的低频反应,就比较容易控制低频音效方向。

阵列大小与形式也会影响改善空间效果所用的技术,而另一因素则是阵列组成目的。举例来说,当阵列摆设以子母画面(PIP)功能为主,也就是让两名观众各自收看不同电视频道,此时便须要为电视前方多名观众创造5.1声道环绕音效。实际上,空间音讯系统可能同时须支援两种以上的方法,才能方便消费者在各种电视节目模式下,都能享受视听体验。

波束成形搭配阵列设计 小型扬声器突破音场限制

目前常用的听觉波束成形技术共有两种,可依应用需求而合并使用。

 .机械式波束成形器

仰赖扬声器实际尺寸与位置产生空间效果。

 .电子式波束成形器

在音讯讯号传至扬声器之前,由数位讯号处理器(DSP)处理讯号。

电子式波束成形原本是为雷达应用研发,应用在音讯方面则始于麦克风阵列,用以撷取语言及音讯。各种相关应用也带动近年来音讯波束成形演算法的创新。

麦克风阵列波束成形的基本概念,在于调整个别阵列项目接收讯号的相位与振幅,让特定方向的综合输出可达最大讯噪比(SNR),此概念类似透过导通频带滤波(Passband Filtering)撷取频率域所需的讯号,差别在于波束成形是在空间内进行,而导通频带则可进行于各种方向。

波束成形技术的种类与相关文献众多,该选择何种技术,通常取决于个别应用的需求与限制。虽然音讯波束成形常用于捕捉音讯讯号,但音讯播放应用却相对有限,主因是立体声系统表现相对优良,且许多应用只要两座扬声器即可。

当前可携式装置机械空间不断缩小,令立体声播放成为一大难题,例如扬声器因尺寸愈来愈小而降低输出音量,或扬声器空间变窄影响立体声声像等。另外,在平面电视方面,因尺寸发展趋于极薄,大幅限制喇叭圆锥状冲程(Excursion),连带也将影响输出音量与音质。为克服上述限制,可采用小型扬声器组成阵列,藉由波束成形技术,可增加整体音量并建构较佳的音场。

扬声器阵列系统传播空间音讯的方式众多,如波场合成(Wave Field Synthesis, WFS)或高保真度立体声音复制(Ambisonics),这些方式通常需要数十、数百部扬声器与大空间,因此多应用在剧场音效设计,不适合用于中小型扬声器阵列。

一般而言,由于音讯的播放与捕捉过程恰好相反,麦克风阵列应用的波束成形技术经调整后,亦适合扬声器阵列应用;但全频宽音讯播放需要的频宽远大于一般语音应用,故选择演算法与设计阵列时,就需要特殊考量。扬声器阵列若要提供空间立体声,则须具备串音消除演算法;此外,扬声器阵列演算法必须尽量减少音讯播放扭曲,包括假影与音色渲染等。

总而言之,空间音讯效果须包括串音消除、机械式与电子式波束成形、HRTF资料(图4)。一直以来,难题便在于如何开发小型阵列技术,提供比单纯使用立体声时更优良的表现,并在没有复杂演算法编程技术的情况下,将这些技术应用于多个扬声器。

  图4 空间音讯技术结合串音消除、头部相关传输函数及波束成形。

空间阵列放大器

因应前述难题,市面上的空间阵列音讯放大器,可在空间受限的应用情况下,为喇叭阵列实作提供身历其境的音讯体验。这里由一款市售音讯放大器为例,其规格为四通道D类音讯积体电路(IC),采用分散电子式波束成形演算法,并运用HRTF资料进行音讯布局(Sound Placement),建立形成波束的喇叭阵列(图5)。

  图5 过滤后的音讯讯号与一个或多个喇叭放大器耦合,经过波束成形,产生理想的空间效果。

在滤波前一阶段运用HRTF时,只要载入符合不同角度的HRTF,即可控制音场的水平延伸范围(Horizontal Span);两阶段处理后产生的整体效果,在听者面前形成两座虚拟扬声器,两座扬声器间的距离则可做调整。

因此,在音讯系列驱动的喇叭阵列内,可采用功能较弱的中央数位讯号处理器(某些状况甚至不需中央数位讯号处理器)。分散式处理亦可提高扬声器阵列的几何排列弹性,使扬声器数量更具弹性。另外,应用时若需要重低音喇叭,其中两通道可采取并联,以提高输出功率。

当多个音讯放大器以多重菊环式相连(Daisy-chained),将可支援更多喇叭;每个装置最高可支援四部扬声器,大幅简化最多六十四座喇叭的阵列设计与建置;同时,其滤波系数可动态更新,提供各种波束成形功能,以因应扬声器阵列组态出现变化,例如扬声器数量的增减。

市面上亦有网路设计工具可供选用,当用户输入阵列几何图形与听者位置后,便可产生喇叭阵列滤波器系数。透过网路设计工具,系统工程师可省去许多麻烦,不必特地编写听觉波束成形或HRTF定位演算法,也不必使用一般用途的数位讯号处理器程式语言或系统设计套件。

网路设计工具的特色在于使用相当方便,只须点选扬声器或听者图示,即可拖曳至设计几何组态内;此外,也有等化工具可供下载,方便扬声器阵列频率等化,调整输出音质。

空间音讯技术进化音讯产品

无论是智慧型手机或大型平面电视,目前越来越多消费性音讯应用,藉由空间音讯技术改善清晰度与深度。透过市售空间阵列晶片,可提供简易又快速的方式,将这些技术落实在喇叭阵列中,并在扬声器有限的空间下,扩大产品音场及输出功率。

若音讯放大器具备准确的波束成形与串音消除功能,则只需一个元件便可适用于二到四座扬声器的应用;采用菊环式连结的多个音讯放大器,将可应用于八、十二、甚至十六个扬声器阵列内,提供更宽广、更精彩的听觉体验。