跳至主要內容

编码、编码器与封装格式

Justin62628大约 12 分钟

提示

以下内容截取自FXXS-Encode-Guideopen in new window,感谢他们的付出

容器

容器(Container)又名封装格式,或者格式(Format),多媒体容器(Multimedia Container),常见的封装格式(MP4/MKV…)、而 H.264/H.265/AC3/AAC 属于编码方式 \ 编码格式(Codec),MP4以及MKV(封装格式)里封装的视频流以及音频流可以使用相同的编码格式

比较常见的MP4,MKV,RMVB,TS,FLV,AVI等很多,各种封装格式支持的编码是不一样的。

MKV vs MP4,主要的区别在于:

  1. MKV支持封装FLAC作为音频,MP4则不支持。但是MP4也可以封装无损音轨(比如说ALAC,虽然普遍认为ALAC的效率不如FLAC优秀)
  2. MKV支持封装ASS/SSA格式的字幕,MP4则不支持。一般字幕组制作的字幕是ASS格式,所以内封字幕多见于MKV格式
  3. MP4作为工业标准,在视频编辑软件和播放设备上的兼容性一般好于MKV(当然Premiere可以装插件支持mkv,iOS Android也可以按照第三方播放器支持),这也是一般压制组为移动设备优化的视频基本上选择MP4封装的原因。

还有一些过时的封装格式,比如RM、AVI等等。

通常mediainfo需要封装格式才能显示比较完整的信息,如.pcm .aac .hevc不能显示时长等信息。.hevc在播放器中是无法使用进度条的。

编码格式

LPCM(Linear pulse-code modulation) 一般也会叫PCM,但是一种特定类型的 PCM,其跟PCM(Pulse Code Modulation)有区别,其量化级别是线性均匀的。

H.26X系列:

由ITU(国际电信联盟)主导,包括H.261、H.262、H.263、H.264、H.265。

  • H.264:H.264/MPEG-4第十部分,或称AVC(Advanced Video Coding,高级视频编码),是一种视频压缩标准,一种被广泛使用的高精度视频的录制、压缩和发布格式。
  • H.265:高效率视频编码(High Efficiency Video Coding,简称HEVC)是一种视频压缩标准,H.264/MPEG-4 AVC的继任者。HEVC不仅提升图像质量,同时也能达到H.264/MPEG-4 AVC两倍的压缩率 (等同于同样画面质量下码率减少50%),可支持4K分辨率甚至超高画质电视,最高分辨率可达8192×4320(8K分辨率),这是目前发展的趋势。

MPEG系列:

由ISO(国际标准组织机构)下属的MPEG(运动图象专家组)主导,视频编码方面主要有:

  • MPEG-1第二部分:主要使用在VCD上,有些在线视频也使用这种格式,该编解码器的质量大致上和原有的VHS录像带相当。
  • MPEG-2第二部分:等同于H.262,使用在DVD、SVCD和大多数数字视频广播系统和有线分布系统(Cable Distribution Systems)中。
  • MPEG-4第二部分:可以使用在网络传输、广播和媒体存储上,比起MPEG-2和第一版的H.263,它的压缩性能有所提高。
  • MPEG-4第十部分:技术上和ITU-TH.264是相同的标准,二者合作,诞生了H.264/AVC标准,ITU-T将其命名为H.264,而ISO/IEC称它为MPEG-4高级视频编码(Advanced Video Coding,AVC)。

AVS(Audio Video coding Standard):

我国自主知识产权的信源编码标准,是《信息技术先进音视频编码》系列标准的简称,目前已完成两代AVS标准的制定。

  • 第一代AVS标准包括国家标准《信息技术先进音视频编码第2部分:视频》(简称AVS1)和《信息技术先进音视频编码第16部分:广播电视视频》(简称AVS+)。AVS+的压缩效率与国际同类标准H.264/AVC最高档次(High Profile)相当。
  • 第二代AVS标准,简称AVS2,首要应用目标是超高清晰度视频,支持超高分辨率(4K以上)、高动态范围视频的高效压缩。AVS2的压缩效率比上一代标准AVS+和H.264/AVC提高了一倍,超过国际同类型标准HEVC/H.265。

其他系列,如,VP8、VP9(Google 主导),RealVideo(RealNetworks推出)等编码方式,在互联网视频使用较少,此处不再介绍。

转码

视频转码(Video Transcoding)是指将已经压缩编码的视频码流转换成另一个视频码流,以适应不同的网络带宽、不同的终端处理能力和不同的用户需求。转码本质上是一个先解码、再编码的过程,因此转换前后的码流可能遵循相同的视频编码标准,也可能不遵循相同的视频编码标准。

转封装(Remux)

转封装指的是将视频或音频的封装格式进行转换,如将AVI的视频转换为MP4,其间并不会进行音视频的编码和解码工作,而是直接将视频和音频压缩码流从一种封装格式文件中获取出来然后打包成另一种封装格式的文件。简单来说就是复制-粘贴。相比转码,转封装有两大特点:
处理速度极快。音视频编解码过程十分复杂,占据了转码的绝大部分时间。转封装不需要进行编码和解码,节约了大量的处理时间。
音视频质量无损。没有解码(解压缩)和编码(压缩)过程,所以不会有音视频的压缩损伤。
转封装后的文件与原始文件的分辨率、码率等几乎一致,故播放时也称其为“原画”。

分离(Demux)

将编码轨道从封装格式中拆出来

无损压缩以及有损压缩

首先PCM和LPCM属于未经压缩的格式,不称为无损压缩。(但叫无损应该也没啥错)

日常中的无损较为口语化,需要理解其意思。通常说的无损格式指的算法无损,并不意味着生成的文件必定无损,一些音轨降位深或降频会造成损失。也会有一些有损转无损的非常规操作。

通常说原盘以及Remux无损,原盘一般是能找到的最优质的源,但其编码格式都属于有损,从母带(口语化)出来进行有损压缩再发布。而Remux主要为视频轨道以及主要音频轨道的无损提取或转换。(不过会有Hybird)

音频相关

DTS(指公司)的音轨的压缩率非常差,并且他们以此作为宣传,认为这样能提高解码效率,音质会更好。

DTS-HD MA 是无损

DTS-HD HRA 是有损

两者同样带核心(DTS core,通常 DTS 会指 DTS core,不过有些我也不知道指的啥)。

其编码器同时包含了DTS Digital(DTS的有损音频格式)的编码核心以便在播放器不兼容DTS-HD MA或DTS-HD HRA(DTS-HD High Resolution Audio)时切换成DTS Digital(DTS Digital一般会以255Kbps的恒定码率进行编码,与DTS-HD MA/HRA音频放置在同一流中,格式名称为DTS-HD Core)

有损音频

AC3是作为影视业的工业标准。但其发布时间非常早。(略早于MP3)

DTS

DTS core 768被认为是不如AC3 640的。

AC3

杜比实验室采用了 MDCT 算法以及感知编码原理来开发 AC-3 音频格式以满足影院需求。 AC-3 格式于 1991 年作为杜比数字标准发布。

  • AC-3 (Audio Codec 3, Advanced Codec 3, Acoustic Coder 3. [不同于Adaptive Transform Acoustic Coding 3/ATRAC3,是索尼研发的另一种格式])

  • Dolby Digital Surround EX

杜比数字环绕EX(Dolby Digital Surround EX),是杜比实验室和Lucasfilm THX在1999年5月面世的星球大战首部曲:威胁潜伏电影中合作的产品。在考虑经济效益和向下兼容性,在左环绕和右环绕中间,加插了后环绕声道,形成6.1输出。它使用了矩阵编码,这是一条独立分离声道,情形就像前置左右声道和中置声道的关系一样。所以它能在标准的5.1设备上输出5.1,又能同时支持杜比数字环绕EX的器材上输出6.1。在星球大战系列中使用了这技术。不少DVD支持杜比数字环绕EX的输出。

  • Dolby Digital EX

杜比数字EX(Dolby Digital EX)是杜比数字环绕EX的民用版本。杜比数字EX类似杜比早期的Pro-Logic技术,集成了矩阵技术,在立体声音轨上加入一中置和一后置声道。杜比数字EX在5.1杜比数字的基础上加入后置声道,创出6.1或7.1的声道输出。但是,这技术并不能视为真正的6.1或7.1编码,与它的竞争对手DTS-ES格式不同,它并不能提供完整独立分离的6条或7条音轨。

Dolby Digital Plus/DDP/EAC3

目前本组的首选格式(1.0/2.0除外,一般建议制作时带EX)

杜比数字Plus(Dolby Digital Plus)又称为E-AC-3,是基于AC3的基础进行加强的编码系统。它把最高比特率提升至6 Mbps,支持14声道(13.1),增强的编码技术能够减少压缩对杂讯(artifact)。无法兼容于Dolby Digital器材,但是Dolby Digital Plus解码器可以将Dolby Digital Plus转码成Dolby Digital 通过光纤/同轴输出。Dolby Digital Plus 是HD DVD和蓝光影碟的必选音频格式。在蓝光播放器中,Dolby Digital Plus是主音轨(Primary Audio)的可选格式,第二音轨(Secondary Audio)必选格式。

AAC

AAC在低码下更有优势。(但Opus做的更好)

因为AAC是一个庞大家族,他们共分为9种规格,以适应不同场合的需要,也正是由于AAC的规格(Profile)繁多,导致普通电脑用户感觉十分困扰:

  • MPEG-2 AAC LC低复杂度规格(Low Complexity)

  • MPEG-2 AAC Main主规格

  • MPEG-2 AAC SSR可变采样率规格(Scaleable Sample Rate)

  • MPEG-4 AAC LC低复杂度规格(Low Complexity),现在的手机比较常见的MP4文件中的音频部分就包括了该规格音频档案

  • MPEG-4 AAC Main主规格

  • MPEG-4 AAC SSR可变采样率规格(Scaleable Sample Rate)

  • MPEG-4 AAC LTP长时期预测规格(Long Term Predicition)

  • MPEG-4 AAC LD低延迟规格(Low Delay)

  • MPEG-4 AAC HE高效率规格(High Efficiency)

上述的规格中,主规格(Main)包含了除增益控制之外的全部功能,其音质最好,而低复杂度规格(LC)则是比较简单,没有了增益控制,但提高了编码效率,至“SSR”对“LC”规格大体是相同,但是多了增益的控制功能,另外,MPEG-4 AAC/LTP/LD/HE,都是用在低比特率下编码,特别是“HE”是有Nero AAC编码器支持,是近来常用的一种编码器,不过通常来说,Main规格和LC规格的音质相差不大,因此目前使用最多的AAC规格多数是“LC”规格,因为要考虑手机目前的存储器能力未达合理水准。

MPEG-4 AAC LC(Low Complexity)是最常用的规格,我们叫“低复杂度规格”,我们简称“LC-AAC”,这种规格在中等码率的编码效率以及音质方面,都能找到平衡点。所谓中等码率,就是指:96kbps-192kbps之间的码率。因此,如果要使用LC-AAC规格,请尽可能把码率控制在之前说的那个区间内。

ffmpeg里

Based on quality produced from high to low:

libopus > libvorbis >= libfdk_aac > aac > libmp3lame >= eac3/ac3 > libtwolame > vorbis > mp2 > wmav2/wmav1

一些有损音频测试

参考资料:

https://web.archive.org/web/20060831191536/open in new window

http://www.rjamorim.com/test/open in new window

https://web.archive.org/web/20110522045514/open in new window

http://cec.concordia.ca/econtact/9_4/tsabary.htmlopen in new window

https://tech.ebu.ch/docs/tech/tech3324.pdfopen in new window

其他注意事项

flac - Free Lossless Audio Codec - 自由无损音频压缩编码

flac既是编码格式也是封装格式

flac同时也是封装格式的名字

https://developer.mozilla.org/zh-TW/docs/Web/Media/Formats/Containersopen in new window

m4a

m4a(封装格式,仅有音频的MPEG-4/mp4文件会使用.m4a扩展名)可以使用ALAC(Apple Lossless Audio Codec)编码也可以使用AAC(Advanced Audio Coding)编码。

mp3

MP3(formally MPEG-1 Audio Layer III or MPEG-2 Audio Layer III) 是由MPEG-1(封装容器)与一个以MPEG-1Audio Layer III encoding编码过的音轨所组成。

wav

WAV属于封装格式,封装的PCM属于原始音频数据,完全未经压缩的编码方式

PCM - 脉冲编码调制(Pulse Code Modulation)是一种模拟信号的数字化方法。它是最常用、最简单的波形编码方式。

LPCM 是一种特定类型的 PCM,虽然PCM是一个更通用的术语,但它通常用于描述编码为LPCM的数据。

BWF(广播声波格式)

后缀也用wav,作为WAV的后继者,是由欧洲广播联盟(European Broadcasting Union)创建的一种标准音频格式。BWF has more data regarding the file. 但音轨质量没有区别

RF64(后缀通常会写w64以作区分)(multichannel audio file)

WAV 文件格式的扩展,其文件大小可大于 4GB。 It has been specified by the European Broadcasting Union. It has been accepted as the ITU recommendation ITU-R BS.2088.

qaac

qaac 是基于 Apple 编码器的命令行 AAC/ALAC 编码器前端。 从 1.00 开始,qaac 直接使用 CoreAudioToolbox.dll。 因此,不再需要安装 QuickTime。 但是,需要 Apple 应用程序支持。 支持 AAC-LC、AAC-HE、ALAC 编码。一般我们制作出来的是LC

(qaac开放源代码,似乎是Copyleft的并且没有任何限制)

H.265

H.265/HEVC 是编码

H.265是标准,HEVC是胜出者,也叫 MPEG-H Part 2

有部分人认为 H.265 在交流中用于指代非 x265 的 HEVC商业编码器(个人认为非标准,并且无定义,属于口语化内容,仅供参考)

并且部分站点要求 Web-dl 标题必须写 H.265,不能使用HEVC,而原盘/Remux只允许写HEVC。(个人认为属于区域规则,不建议作为标准理解)

x265是开源免费编码器,另外还有一些商业的编码器,例如视骏open in new window, NVENCopen in new window

上次编辑于:
贡献者: Justin62628,DAMNCRAB