常用音频协议介绍

会议电视常用音频协议介绍及对比白皮书

一、数字化音频原理:声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。通常人耳可以听到的频率在20Hz到20KHz的声波称为为可听声,低于20Hz的成为次声,高于20KHz的为超声,多媒体技术中只研究可听声部分。

可听声中,话音信号的频段在80Hz到3400Hz之间,音乐信号的频段在20Hz-20kHz之间,语音(话音)和音乐是多媒体技术重点处理的对象。

由于模拟声音在时间上是连续的,麦克风采集的声音信号还需要经过数字化处理后才能由计算机处理。通常我们采用PCM编码(脉冲代码调制编码),即通过采样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

1、采样

采样,就是每隔一段时间间隔读一次声音的幅度。单位时间内采样的次数称为采样频率。显然采样频率越高,所得到的离散幅值的数据点就越逼近于连续的模拟音频信号曲线,同时采样的数据量也越大。

为了保证数字化的音频能够准确(可逆)地还原成模拟音频进行输出,采样定理要求:采样频率必须大于等于模拟信号频谱中的最高频率的2倍。

常用的音频采样率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。

例如:话音信号频率在0.3~3.4kHz范围内,用8kHz的抽样频率(fs),就可获得能取代原来连续话音信号的抽样信号,而一般CD采集采样频率为44.1kHz。

2、量化

量化,就是把采样得到的声音信号幅度转换成数字值,用于表示信号强度。

量化精度:用多少个二进位来表示每一个采样值,也称为量化位数。声音信号的量化位数一般是 4,6,8,12或16 bits 。

由采样频率和量化精度可以知道,相对自然界的信号,音频编码最多只能做到无限接近,在计算机应用中,能够达到最高保真水平的就是PCM编码,通常PCM约定俗成了无损编码。

3、编码

一个采样率为44.1kHz,量化精度为16bit,双声道的PCM编码输出,它的数据速率则为 44.1K×16×2 =1411.2 Kbps,存储一秒钟需要176.4KB的空间,1分钟则约为10.34M,因此,为了降低传输或存储的费用,就必须对数字音频信号进行编码压缩。

到目前为止,音频信号经压缩后的数码率降低到32至256kbit/s,语音可以低至8kbit/s以下。

对数字音频信息的编码进行压缩的目的是在不影响人们使用的情况下使数字音频信息的数据量最少。通常用如下6个属性来衡量:

—比特率;

—信号的带宽;

—主观/客观的语音质量;

—延迟;

—计算复杂度和对存储器的要求;

—对于通道误码的灵敏度;

为使编码后的音频信息可以被广泛地使用,在进行音频信息编码时需要采用标准的算法。传统会议电视设备主要采用ITU-T推荐的G.711、G.722、G.728和AAC_LD等音频标准。

二、常用音频协议简介:

1、    ITU-T G.728

1992年ITU-T发布的电话声音信号编码方式推荐标准。采用LD-CELP编码方式,采样率为8KHz,以16kb/秒的速度传送声音信号,传送延迟时间极短,仅有0.625 ms 的算法编码延迟。

2、    ITU-T G.711

标准公布于1972年,其语音信号编码是非均匀量化PCM。语音的采样率为8KHz,每个样值采用8bit量化,输出的数据率为64kbps。这种窄带编码支持对300到 3,400赫兹的音频进行压缩。但虽然压缩质量不错,但是消耗的带宽相对较大,主要用于数字PBX/ISDN上的数字式电话。

3、    ITU-T G.722

ITU-T G.722标准是第一个用于 16 KHZ 采样率的标准化宽带语音编码算法,1984年被CCITT定义为标准,而且现今还在使用。.G.722 编解码器在 16 kHz 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 64、56 与 48 Kbit/s,其总延迟约 3 ms,能够提供更好的通话质量。

G.722的优点是延时和传输位误差率非常低,且没有任何的专利技术,费用低廉。因此G.722在无线通信系统,VoIP生产商,个人通信服务,视频会议应用等广泛应用。

4、    G.722.1

G.722.1基于 Polycom 的第三代 Siren 7 压缩技术,1999年被ITU-T批准为G.722.1标准。G.722.1采用16 KHZ 采样频率,16 位数据量化,支持从 50 Hz 至 7 kHz频率范围的音频采样,并将其压缩为 32 与 24 Kbit/s。它采用20 ms封帧,提供40ms的算法延迟。

G722.1可实现比 G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现与 G.722 大致相当的质量。这种编码使用许可需要获得Polycom公司的授权。

5、    G722.1 Annex C

G722.1 Annex C基于 Polycom 的Siren 14 压缩技术, 采用32kHz采样频率,支持从 50 Hz 至 14 kHz频率范围的音频采样,并将其压缩为 24、32或48 kbps。采用20ms封帧,提供40毫秒演算延迟。

2005年中,国际电信联盟(ITU)批准Polycom Siren 14™    技术为14 kHz超宽带音频编码新标准。同时进入作为ITU-T建议的G.722.1 Annex C。    G722.1 Annex C具有低运算能力,低带宽的优点。适于处理语音、音乐与自然界声音。

6、    AAC-LD

AAC(Advanced Audio Coding,高级音频编码)是由Fraunhofer研究院(MP3格式的创造者)、杜比(DOLBY)试验室和AT&T(美国电话电报公司)共同研发出的一种音频压缩格式,是MPEG-2规范的一部分,并在1997年3月成为国际标准。随着MPEG-4标准在2000年成型后,MPEG2 AAC也被作为核心编码技术,并增加了一些新的编码特性,又叫MPEG-4 AAC。

MPEG-4 AAC家族目前共有九种编码规格,AAC-LD(Low Delay,低延迟规格)是用在低码率下编码。它支持8K~48K采样率的,可以64Kbps的码率输出接近 CD 音质的音频,并支持多声音通道,AAC-LD 算法延迟仅为 20ms。

AAC因为其模块化设计,功能更为强大。本身的框架结构能够被不断的新的东西填充,这就使得不同发展方面的内核相互融合,彼此吸收精华成为可能。

7、   各种音频协议的主要参数对比:

采样频率   支持音频带宽    输出码率    最低算法延迟

G711   8KHz    300 Hz ~ 3,400 Hz    64 Kbps    <1ms

G722   16kHz    50 Hz ~ 7 kHz    64 Kbps    3ms

G722.1   16kHz    50 Hz ~7 kHz    24、32 Kbps    40ms

G722.1 C   32kHz    50 Hz~14 kHz    24、32、48Kbps    40ms

AAC-LD   48kHz    20 Hz-20kHz    48~64 Kbps    20ms

三、AAC_LD与G722. Annex C优缺点对比:

G722.1 C   AAC_LD

采样音频频率范围支持50 Hz~14 kHz,接近CD音质,但丢失了高频部分。

支持20 Hz-20kHz全频段的采样,音频更加接近CD音质。

输出码率24、32、48Kbps,带宽低于AAC-LD,但是以牺牲高频为代价的。

48~64 Kbps,并支持大于64Kbps的输出,为更好的音频质量提供了可能。

算法复杂性算法复杂度低,CPU占用率略好于AAC-LD   模块化设计,功能更为强大,有TI等专用芯片支持

最低延迟采用20ms封帧,40ms算法延迟   20ms算法延迟,好于G722.1 C

多声道可以支持双声道   AAC支持多达48个音轨、15个低频音轨

标准通用性G722.1-C 由Polycom制定开发,使用需要Polycom授权,目前只有Polycom和极少数会议电视厂商使用。   作为MPEG4核心标准,受到Apple、诺基亚、松下等支持,并被泰德等众多会议电视厂商所采用,应用前景更广阔。

由Fraunhofer研究院的调查对比图可以知道,在相同的采样频率下,AAC-LD可以提供比G722.1 C、MP3等更好的音质。AAC-LD实现了超宽频音频编码中最短的延时,并保证接近CD的音质,达到音质、比特率和延时三者的最佳组合,是会议电视领域的最优选择。

(0)

相关推荐

  • (FFMpeg学习笔记):基本概念

    [声明]课程学习地址:https://ke.qq.com/course/468797 目录 [音视频录制原理] [音视频播放原理] 图像表示-RGB格式 图像表示-YUV格式 图像表示-YUV格式1 ...

  • 蓝牙音频编码简介 - SBC、AAC、AptX、LDAC、LHDC

    早在2000年,蓝牙耳机就已经出现,但由于技术限制,只能用于通话.2008年,随着蓝牙A2DP(Advanced Audio Distribution Profile)开始普及,立体声蓝牙耳机日渐流行 ...

  • AC3音频编码

    一.AC3介绍 AC3(Audio Coding 3),压缩比约为1:9~10.全频域响应3-20000Hz.超低音声道包含了一些额外的低音信息,如爆炸.撞击声等,频率响应为3-120Hz,又称&qu ...

  • 蓝牙音频编码哪个音质好?今天我们来逐一解读

    总听到不少人说蓝牙音质不好.音质不行.巴拉巴拉的--,蓝牙技术通过二十多年的发展,版本迭代从1.0-5.1,其实蓝牙早已不是之前那个蓝牙了. 所以,如果你觉得蓝牙音质不好,可能有两个原因,一是设备太过 ...

  • 手机厂商纷纷取消耳机孔,然而无线听歌的音质竟也有这些差别!

    自从苹果 iPhone 7 取消 3.5mm 耳机孔,改用 Lightning 接口进行音频输出后,便引来大批手机厂商的跟风.例如今年上半年发布的三款国产骁龙 835 旗舰,其中竟有两款取消了耳机孔, ...

  • 电脑音频接口介绍,知道这几个音频接口,就再也不会插错音频线了

    电脑每隔一段时间就需要清理灰尘,这个时候我们就需要把音频线等外接线取下来.但是声卡上有好几个插孔,我们有时候会忘记了,在哪个插口上插的呢?只要你掌握了下面的音频线插接方法和原则,就不会担心插错了. 主 ...

  • BC1.2快充协议介绍

    BC1.2定义 BC1.2 (Battery Charging v1.2)是USB-IF下属的BC(Battery Charging)小组制定的协议,主要用于规范电池充电的需求,该协议最早基于USB2 ...

  • AESQ航空发动机供应商质量小组-常用五大工具介绍AS9145|AS13004|AS13003|AS13000|AS13006

    一.AESQ零缺陷前言 2012年,罗尔斯·罗伊斯,普惠,GE航空和赛峰集团的高层管理人员要求其高级质量管理人员共同努力,以推动整个航空发动机供应链的快速变化.随后,该小组于2013年成立了G-22技 ...

  • “皮肌炎、类风关、痛风”的常用对药介绍!

    一.芙蓉叶配紫草,效专凉血活血散热解毒. 芙蓉叶首载于<本草纲目>,其味微辛,气平. 李时珍谓其"气平而不寒不热.味微辛而性滑涎黏,其治痈肿之功,殊有神效",后人用于治 ...

  • “皮肌炎、类风关、痛风”的常用对药介绍

    杏林讲坛 公众号 1 芙蓉叶配紫草,效专凉血活血散热解毒 芙蓉叶首载于<本草纲目>,其味微辛,气平. 李时珍谓其"气平而不寒不热.味微辛而性滑涎黏,其治痈肿之功,殊有神效&quo ...

  • 第33课【常用布线系统参数介绍】

    近一年,随着CAT.8的推广,目前网络线材又开始在市场有所人气,今天我们就一起看看聊聊常用布线系统参数.Cat8正式出江湖?扒扒它与Cat5.Cat6.Cat7网线的区别 ☞EIA/TIA.568 定 ...

  • 【技术】20种常用杀虫剂 全介绍(最新整理)

    农业信息资讯 专注于农资,提供最专业,最全面,最及时的农资资讯,产品信息.招商合作,开启财富之路! 54篇原创内容 公众号 1.甲维盐 胃毒和有触杀作用,害虫发生不可逆转麻痹,停止进食,2-4天后才能 ...

  • 常用香料功效介绍

    香辛料是指能够赋予食品辛.香.麻.辣.苦.甜等典型气味的可食用香料植物,所使用的大多数香料同时也是传统的中草药. 为了便于大家学会各种香料的特性,我们特地为大家归纳了57种,以便大家日后使用更加得心应 ...

  • 干货,实验室常用质控规则介绍及失控的处理!

    导读: 实验室常用质控规则介绍及失控的处理 一.质控规则概述 质控规则是解释质控数据和作出质控状态判断的决策标准. 质控规则以符号AL表示 A是测定质控标本数或超过质控限(L)的质控测定值的个数 L是 ...