AOMedia Video 1
此條目需要精通或熟悉相关主题的编者参与及协助编辑。 |
此條目可参照外語維基百科相應條目来扩充。 (2017年6月24日) |
AOMedia Video 1(简称AV1)是一個開放、免專利的影片編碼格式,專為通过网络进行串流传输而设计。它由開放媒體聯盟(AOMedia)開發,目標是取代其前身VP9[2],該聯盟由半導體企業、隨選視訊供應商和網頁瀏覽器開發商於2015年成立。2018年,Facebook進行接近真實使用環境條件測試,測試結果顯示AV1資料壓縮率與x264 main profile、x264 high profile和libvpx-vp9相較之下,分別提昇50.3%、46.2%和34.0%[3]。
开发者 | 開放媒體聯盟 |
---|---|
初始版本 | 2018年3月28日 |
最新版本 | 1.0.0 Errata 1[1] 2019年1月9日 |
格式类型 | 壓縮影片 |
使用容器 | |
扩展自 | |
标准 | AOM AV1 |
免费格式? | 是 |
网站 | aomedia.org/av1-features/ |
與VP9類似,但與H.264/AVC和HEVC不同的是,AV1具有買斷式授權模式,不會阻礙開源項目的採用[4][5][6][7][8][9]。
歷史進程
開放媒體聯盟(AOMedia)創建AV1主因包括涉及HEVC的高成本專利許可與模糊空間,此外,由MPEG設計之編解碼器有望取代AVC[10][11]。联盟最初由七間公司,Amazon、Cisco、Google、Intel、Microsoft、Mozilla和Netflix所組成,並宣布技術重点為提供高品質網路影像[12]。於2015年7月21日,HEVC Advance,現為ACCESS Advance,初始授權被宣布增加对AVC的權利金[13],除了權利金所增加的成本外,還增加了授權複雜度。这進而促成了同年9月1日,开放媒体联盟發布AV1的官方公告並宣布成立。与過往MPEG規範不同,MPEG可以只從MPEG-LA获得许可,而当完成HEVC規範时,已经形成了兩個專利池,第三個專利池也即將出現。普遍而言,專利持有人拒絕將專利共享於專利池上,這增添HEVC授權的不确定性。據微软的Lan LeGrow所說,开源、免版税可视为不确定性消除的方法[10]。
此外,创建AV1另一个原因是专利授權对免费开源软件的负面影响[11]。例如在瀏覽器中实现H.264,将被禁止使用,除非向MPEG-LA支付權利金[14]。欧洲自由软件基金会认为,由于与自由软體许可证的各种不兼容,公平及合理非歧視條款许可实践使标准的自由软體实施成为不可能[15]。
AV1的組成来自联盟成员過往的研究與工作內容,分別在几年前就开始实现实验性平台,如:Xiph與Mozilla的Daala,Google實驗性質的VP9提升為VP10,並于2014年9月12日公布[16],以及Cisco的Thor于2015年8月11日发布。AV1以VP9的代码库为基础,與其他技術结合產生[17],AV1 編解碼器参考規範初始版本 0.1.0,並於 2016 年 4 月 7 日发布。
2017年10月下旬,尽管對於開發的冻结開始生效,但數個重要功能仍在繼續發展。其中一项正在開發的功能──比特流格式,原定于2018年1月冻结開發,但仍有关键错误,以及需要对转换方法、语法設計、运动矢量预测的修改,也有法律的妥善性問題,最終發布日期延期至同年3月28日,联盟发布官方AV1比特流规范與軟體的编解码器參考規範[18],2018年6月25日发布經驗證過後的比特流规范1.0.0版[19],最終於2019年1月8日,发布1.0.0版附帶的規格刊誤。
據聯盟成员Bitmovin中Martin Smole表示,在比特流格式完成凍結後,计算效率在官方參考编解码器仍具挑戰[20]。虽然尚可處理比特流格式,但此並非商用用途,速度优化也未考量。因此,早期版本的AV1比现有的HEVC编码器慢几个数量级。近期,开发者趨於優化官方参考编码器。發布後一年的2019年3月,参考编码器的效率有大幅提升,并且与其他常见的编解码器在可比擬的效率範圍內[21]。
技术
AV1是一种使用传统的基于区块编码但也加入了新技术的频率变换格式,AV1所使用的编码技术主要来源于谷歌VP9的下一代视频压缩格式VP10,但同时也包含了由Xiph.Org基金会的主要赞助者Mozilla开发的Daala视频压缩格式和由Cisco开发的Thor视频压缩格式中所使用的视频编码技术。
开放媒体联盟根据FreeBSD 2许可证发布了一个用C语言和汇编语言编写的编解码器参考实例libaom。该参考实例的开发接受开放媒体联盟成员资助并且公开进行。此外还有另一个开源编码器rav1e,rav1e编码器以牺牲编码效率为代价,成为最简单、最快符合AV1标准的视频编码器[22]。
分區
於此,帧的内容被劃分(Partitioning)為相間、相鄰且大小相同的區塊,称为超區塊。相似於宏區塊的概念,超區塊呈現方形,大小可為128×128或64×64像素。超區块可以根据不同的分区模式划分为更小的區塊。四方分割模式(four-way split pattern)是唯一可以递归將分区細分的模式。这允许将超區块從大區塊划分为小至4×4像素的分區。
T形分区模式是VP10开发的一項新功能,水平或垂直拆分超區塊分割为4:1和1:4長條形分區。分区模式的使用因超區块大小而有所限制,其中128×128和8×8超區块都不能使用4:1或1:4長條型分區拆分,而只有8×8超區块則不能使用T形分割。
在不同區块空間的部分上使用两个獨立預測,可以使用平滑的倾斜过渡线(楔形分区预测)。这使得對象得以准确地分割,而无需沿方形边界的傳統阶梯线。
基於瓦形行列之间的可预测的相依性這使得可以实现更多的编码器平行性[23]。
預測
AV1以更高的精度(10或12位樣本頻率)执行内部处理,由于解析度提高,图像中的四捨五入的误差较小,使得压缩效能改进。
预测(Prediction)可以在一个區块中以更高级的方式组合成复合预测,包括不同方向平滑與尖锐的楔形分区预测,以及基于使用兩個預測器探究两者之间差异的隐式掩码,這將比取平均來得優秀。这允许在同一超區块中使用两个帧间预测或帧间和帧内预测的组合[24]。
于帧间预测時,一个帧可以訪問8个可用帧缓冲区中的6个而不是3个,且可同時为双向预测,即帧间與帧内预测组合預測[25]。
在AV1中的扭曲运动[23]和全局运动分析工具,用於藉由识别由相机运动产生的模式,以减少运动向量中的冗余資訊,如噪音即為冗於資訊[23]。這實現了以往的格式中试图卻仍未被實現的做法,例如尽管采用适用于三维的新颖方法的MPEG-4 ASP。比特流中提供的帧有一組扭曲参数,隐式區域参数可根据周围的區块计算得到並於區块中使用。
切换帧(S帧)是一种新的帧间类型,可以使用来自同一影像更高分辨率的已解码参考帧进行预测以允许切换至低分辨率,於自適性比特串流媒体實例中,无需在开始时使用完整的关键帧影像片段。
帧内预测
帧内预测(Intra Prediction)使用当前帧中可用資訊来预测目標區块的像素。大多数情况下,帧内预测是从待预测目標區块上方和左侧的相邻像素构建的。DC预测器藉由平均區块左侧和上方像素進行预测。
根据指定的角度,方向预测器可以推斷相邻像素。在AV1中,以45度角开始,每次差距22.5度,逐步增加至203度,共計八種模式。每个方向模式中,可以为較大的區块給予每個3度,共計六組的偏移信号,主角上方與下方各三組,从而产生总共56个角。
其中,真實運動预测器被替换为Paeth预测器,這將判別左上角已知像素與新像素的左侧與上方的的像素的差异,而後选择位于较小梯度方向的像素作为预测器。
另调色板预测器可用于較少顏色最多8个顏色的區块,如部分電腦螢幕内容,可使用基于亮度平面样本的色度块预测器来利用亮度和颜色信息之间的相关性[23]。
为了减少沿帧间预测區块边界的可視边界,可使用重叠块运动补偿(OBMC)技术,与相邻區块重叠2到32个像素,并混合重叠部分[26]。
数据转换
为了将预测后剩余的误差转换(Data transformation)到频域,AV1编码器可以使用正方形、或2:1/1:2和4:1/1:4矩形進行離散餘弦變換[25],以及非对称的離散正弦變換[27][28],对来自附近像素,預測左侧或上方边缘具有较低误差的區块,或者选择不进行变换。
這可以複合两个一维变换,使得水平和垂直维度得以使用不同的变换。
量化
AV1 具有最佳化量化(Quantization)矩阵,每帧可选择和发送資訊八组量化参数,具有两个色度平面的单独参数,并且可以使用空间预测。在每个新的超區块上,量化参数可以通过发送偏移信号進行调整。
濾波器
Thor的约束低通滤波器(Filter)和Daala的定向去振鈴滤波器,對于环路滤波有卓越的成效:結合二者之约束定向增强滤波器,超过了单独或一起使用一般濾波器的结果。
這是一种边缘定向条件替换滤波器,平滑具有可配置强度的區块沿主要边缘方向,以消除振铃效應。
还有基於Wiener滤波器和自引导恢复滤波器的环路恢复滤波器,用于去除由于區块处理引起的模糊振鈴。
胶片颗粒合成使用参数视频编码方法改进了噪声信号的编码。由于胶片颗粒噪声固有的随机性,该信号分量传统上编码成本昂貴,容易遺失與損壞,並可能会留下严重的编码振鈴作为残留物。使用胶片颗粒合成来规避这些问题,其使用视觉上主观视觉印象相似的部分替换部分信号而不是客观相似性。消除从信号中去除颗粒成分與分析其非随机特征,取而代之的是仅将描述性参数传输到解码器,解码器会添加回原始組成成分之後重塑並合成伪随机噪声信号。胶片颗粒合成是AC3、AAC、Vorbis和Opus音频编解码器中使用的感知噪声替代技术的视觉等效项。
熵编码
Daala的熵编码器,是一種非二进制的算术编码器,作為替代原先VP9二进制的编码器。非二进制算术编码的有利於避開現有專利,同時也讓比特層級的串列過程增加了平行性,藉而降低硬體实现對於石英震盪器的速率要求。如前文參考之適應性二元算術編碼之现代二进制算术编码的有效性,其正在使用比二进制更大的字母表来实现,因此速度更快,就像霍夫曼編碼一樣,雖然仍不及霍夫曼編碼簡單而快速。AV1在算术编码器中擁有按编码符号而不是按帧调整符号概率的能力[23]。
可適性視訊編碼
对于視訊最重要的是,可適性視訊編碼是一种泛用技术而不是由AV1独有,以便可以从更高比特率的影像流中提取质量更好的低比特率视频流。這與自适应比特率流传输差別在於,每个更高比特率适配中的一些压缩效率被放弃,以获得整体影像流的效能。编码过程也较少冗余與較低的要求。
AV1提供了时间和空间可適性[29],帧速率和分辨率都是定义為低比特流可用的方法。
编码规范
AV1拥有三种設定供解码器使用Main、High与Professional。Main允许8、10位元的色彩深度以及4:0:0(灰阶)和4:2:0的色度抽样。High后续会支持4:4:4的色度抽样。Professional将会完整支持4:0:0、4:2:0、4:2:2、4:4:4的色度抽样以及8、10、12位元的色彩深度[30]。
Main (0) | High (1) | Professional (2) | ||
---|---|---|---|---|
色彩深度 | 8、10 | 8、10 | 8、10、12 | |
色度抽样 | 4:0:0 | 是 | 是 | 是 |
4:2:0 | 是 | 是 | 是 | |
4:2:2 | 否 | 否 | 是 | |
4:4:4 | 否 | 是 | 是 |
軟體支持
- Web浏览器:
- 影像播放器:
- 编码器:
- 影像编辑:
- DaVinci Resolve(自2021年5月17.2版起支持解碼)
- 其他:
- GStreamer(自1.14版起)[45]
- MKVToolNix(自版本28开始采用最终的av1-in-mkv规范)
- MediaInfo(自18.03版起)[46]
- Elecard StreamEye Studio(影像品質分析工具)
- Google Duo(自2020年4月起)[47]
採用
YouTube已開始嘗試在部份影片使用AV1影片格式。2020年2月5日,Netflix開始在Android裝置上使用AV1影片格式播放影片,AV1的壓縮效率較原先的VP9提升了20%[48]。Facebook表示AV1性能超乎預期,一旦時機成熟將逐步採用AV1影片格式[49]。
Twitch計劃在2022年或2023年於關注度較高的影片採用AV1影片格式,並在2024年或2025年全面採用[50]。
2020年4月30日,愛奇藝宣佈在電腦瀏覽器和Android設備上支持AV1視頻格式[51]。
2022年2月6日,哔哩哔哩已在网页端测试AV1视频格式的解码播放。
參考資料
- ^ Release AV1 Bitstream & Decoding Process Specification (v1.0.0-errata1). Github.com. 9 January 2019 [31 March 2019]. (原始内容于2019-08-08).
- ^ . [2018-04-01]. (原始内容存档于2018-07-28).
- ^ AV1 beats x264 and libvpx-vp9 in practical use case. Facebook Engineering. 2018-04-10 [2020-07-16]. (原始内容于5 November 2019) (美国英语).
- ^ An Invisible Tax on the Web: Video Codecs. 2018-07-11 [4 January 2019]. (原始内容于5 January 2019).
Mozilla uses Cisco’s OpenH264 in Firefox. If not for Cisco’s generosity, Mozilla would be paying estimated licensing fees of $9.75 million a year.
- ^ Mozilla Explains Why it Doesn't License h264. 24 January 2010 [7 September 2020]. (原始内容于5 December 2020).
- ^ Yoshida, Junko. Streaming Group to Pit AV1 Against H.265. EE Times. AspenCore, Inc. 2018-03-28 [4 April 2019]. (原始内容于4 April 2019).
- ^ Bright, Peter. Microsoft, Google, Amazon, others, aim for royalty-free video codecs. Ars Technica. Condé Nast. 2015-09-01 [5 April 2019]. (原始内容于11 July 2021).
- ^ Zimmerman, Steven. Google's Royalty-Free Answer to HEVC: A Look at AV1 and the Future of Video Codecs. XDA Developers. 15 May 2017 [10 June 2017]. (原始内容于14 June 2017).
- ^ Why is FRAND bad for Free Software?. 20 June 2016 [8 April 2019]. (原始内容于6 June 2019).
As Free Software gives each user the freedom to redistribute the software itself, keeping track and collecting royalties based on distributed copies is also, in practice, impossible.
- ^ 10.0 10.1 Staff, Ars. . Ars Technica. 2015-09-01 [2021-07-01]. (原始内容存档于2021-07-11) (美国英语).
- ^ 11.0 11.1 Shankland, Stephen. . CNET. [2021-07-01]. (原始内容存档于2021-07-09) (英语).
- ^ . Cisco Blogs. 2018-03-28 [2021-07-01]. (原始内容存档于2021-04-26) (美国英语).
- ^ . Streaming Media Magazine. 2015-12-01 [2021-07-01]. (原始内容存档于2021-07-11) (美国英语).
- ^ Andreas. . Andreas Gal. 2014-10-14 [2021-07-01]. (原始内容存档于2021-07-11) (英语).
- ^ . FSFE - Free Software Foundation Europe. [2021-07-01]. (原始内容存档于2021-07-09) (英语).
- ^ Shankland, Stephen. . CNET. [2021-07-01]. (原始内容存档于2021-03-29) (英语).
- ^ . GPAC Licensing. 2016-07-12 [2021-07-01]. (原始内容存档于2021-07-11) (美国英语).
- ^ Shilov, Anton. . www.anandtech.com. [2021-07-01]. (原始内容存档于2021-07-12).
- ^ . phoronix.com. [2021-07-01]. (原始内容存档于2021-07-09).
- ^ Hunter, Philip. . [2021-07-01]. (原始内容存档于2021-07-12) (英国英语).
- ^ . Streaming Media Magazine. 2019-03-04 [2021-07-01]. (原始内容存档于2021-05-14) (美国英语).
- ^ The fastest and safest AV1 encoder.. [9 April 2018]. (原始内容于2020-05-29).
- ^ 23.0 23.1 23.2 23.3 23.4 . Streaming Media Magazine. 2017-08-30 [2021-07-01]. (原始内容存档于2021-07-11) (美国英语).
- ^ (PDF). [Archived from the original (PDF) on 20 September 2017. Retrieved 19 September 2017.]. 原始内容存档于2017-09-20.
- ^ 25.0 25.1 Mukherjee, Debargha; Su, Hui; Bankoski, James; Converse, Alex; Han, Jingning; Liu, Zoe; Xu, Yaowu. An overview of new video coding tools under consideration for VP10: the successor to VP9. Applications of Digital Image Processing XXXVIII (International Society for Optics and Photonics). 2015-09-22, 9599: 95991E. doi:10.1117/12.2191104.
- ^ . Streaming Media Magazine. 2017-10-11 [2021-07-01]. (原始内容存档于2021-07-11) (美国英语).
- ^ Han, Jingning; Saxena, Ankur; Melkote, Vinay; Rose, Kenneth. (PDF). IEEE Transactions on Image Processing.: 1874–1884. [2021-07-01]. 原始内容存档于2012-07-13.
- ^ R, Bhagyashree. . Packt Hub. 2018-11-12 [2021-07-01]. (原始内容存档于2021-07-11) (美国英语).
- ^ (PDF). [31 July 2018. Retrieved 21 December 2018]. (原始内容 (PDF)存档于2019-10-16).
- ^ Shilov, Anton. Alliance for Open Media Releases Royalty-Free AV1 1.0 Codec Spec. AnandTech. 2018-03-30 [2 April 2018]. (原始内容于2019-02-26).
- ^ Millicast. . Medium. 2019-07-09 [2021-07-01]. (原始内容存档于2021-07-10) (英语).
- ^ . Mozilla Hacks – the Web developer blog. [2021-07-01]. (原始内容存档于2021-01-28) (美国英语).
- ^ . slashdot.org. [2021-07-01]. (原始内容存档于2021-07-11) (英语).
- ^ Li, Abner. . 9to5Google. 2021-04-15 [2021-07-01]. (原始内容存档于2021-05-12) (美国英语).
- ^ . Techdows. 2018-10-19 [2021-07-01]. (原始内容存档于2021-07-09) (美国英语).
- ^ . Opera Desktop. 2018-11-28 [2021-07-01]. (原始内容存档于2020-07-16) (美国英语).
- ^ . slashdot.org. [2021-07-01]. (原始内容存档于2021-07-11) (英语).
- ^ Ødegaard, Ruarí. . Vivaldi Browser. 2018-10-18 [2021-07-01]. (原始内容存档于2021-05-11) (英语).
- ^ Tung, Liam. . ZDNet. [2021-07-01]. (原始内容存档于2021-03-08) (英语).
- ^ , mpv, 2021-07-01 [2021-07-01], (原始内容存档于2016-10-04)
- ^ . potplayer.daum.net. [2021-07-01]. (原始内容存档于2020-09-09).
- ^ . codecguide.com. [2021-07-01]. (原始内容存档于2021-06-30).
- ^ . Streaming Media Magazine. 2018-09-27 [2021-07-01]. (原始内容存档于2021-07-10) (美国英语).
- ^ . handbrake.fr. [2021-07-01]. (原始内容存档于2021-06-28).
- ^ . Bitmovin Documentation. [2021-07-01]. (原始内容存档于2021-07-11) (英语).
- ^ . phoronix.com. [2021-07-01]. (原始内容存档于2021-07-09).
- ^ Neowin ·, Razvan Serea News Reporter. . Neowin. [2021-07-01]. (原始内容存档于2021-07-09) (英语).
- ^ Abner, Li. Netflix starts streaming AV1 on Android to save cellular data. 9to5Google. 5 February 2020 [5 February 2020]. (原始内容于2020-02-05).
- ^ Baumgartner, Jeff. Facebook: Tests Show AV1 Streaming Performance Is Exceeding Expectations. Multichannel. 2019-02-08 [2019-02-10]. (原始内容于2019-02-14).
- ^ Ozer, Jan; Shen, Yueshi. NAB 2019: Twitch Talks VP9 and AV1 Roadmap. YouTube. 2 May 2019 [30 May 2019]. (原始内容于2020-07-12).
but we're hoping, towards 2024-2025 the AV1 ecosystem's ready, we wanna switch to AV1 a 100%. … this is our projection right now. But on the other hand, as I said, our AV1 release will be, for the head content will be a lot sooner. We are hoping 2022-2023 is we are going to release AV1 for the head content.
- ^ 存档副本. [2020-06-07]. (原始内容于2020-06-07).
引用错误:在<references>
标签中name属性为“VP9 successor”的参考文献没有在文中使用
<references>
标签中name属性为“codec wars”的参考文献没有在文中使用