2008/04/06

パーマリンク 15:21:41, 著者: Charlie

x264 | VAQの効果はどのくらい?

先の記事で取り上げた「分散に基づく量子化パラメータの適応型決定(VAQ)」のご利益をおさらい。

...

フレーム内にビットがたくさん必要な部分とそうでない部分がある場合に、品質を落とさずにファイルサイズを小さくできる

AQの目的は、これに尽きる。ファイルサイズを変えなくてよいなら品質は向上する。百聞は一見に如かずなのでサンプル。

  • Umamio氏による画質の比較 (サッカー)
    http://www.freeimagehost.eu/image/8fd4c82908457
    上から順に、VAQ無効、aq-strength=1, 1.5, 2、元画像。 芝生のケバケバ感がVAQによって再現されるようになっていることが分かる。平均ビットレートの違いは数%の範囲なので、ファイルサイズを変えずに品質が向上したと言える。

効果が顕著なのは、YouTubeやニコニコ動画、iPodやPSPなどビットレートが低めのターゲットの場合。絵的には、平行移動しかしない背景と、形状が変わる細かい線の多い前景の組み合わせに効果的…ということは、サッカーのフィールド全体とか、アニメとか、アナウンサーの横にスーパーインポーズされた動画が映っているニュースとか。

暗い・青い領域に明るい点がある場合にブロック歪が目立たなくなる

x264以外のMPEG系エンコーダにもAQが実装されているが、x264 Sharktooth版のは特にこの問題への対策をしている。
星空を含む場合は--aq-*を使うとよい

元動画がノイジーなアナログキャプチャでも、きれいなデジタルストリームでも、この効果は有効。

実測

Leben ist vorbei \(^o^)/で実験結果が次のようにまとめられているが、残念ながら効果の程度がよく分からない。

  • 画質: 目に見えない範囲で僅かに低下
  • 圧縮率: 良くなっている

そこでSharktooth版も含めて実験を再現してみたところ、Sharktooth版とそれ以外のAQは全然効き方が違うことが分かった。

ビルドパラメータ平均QPビットレート (kb/s)PSNR(Y/U/V)
0.56.667 (Sharktooh)CRF19, AQ off 16.00 151.1464.808, 62.301, 61.652
CRF21, AQ off18.00162.2764.137, 60.831, 61.571
CRF22, AQ off19.00147.6962.502, 62.105, 63.823
CRF19, AQ
str=0.3, sens=22
16.00166.6865.491, 62.572, 62.33
CRF19, AQ
str=0.6, sens=22
16.00172.4465.857, 62.572, 62.245
CRF22, AQ
str=0.3, sens=22
19.00158.6363.077, 62.127, 64.415
CRF19, AQ
str=0.3, sens=0
16.00185.0966.084, 62.775, 62.397
0.58.777M 02e6102
(VAQ2.0)
CRF19, AQ
mode=2, mtr=0, str=0.6
17.84172.2464.366, 62.480, 61.691
CRF19, AQ
mode=2, mtr=3, str=0.6
16.90164.0066.493 , 60.920, 61.803

Sharktooth版のAQは暗い色と別の色との境界でしかQPが変わっていない。 それに対して、Dark Shikari版は色領域ごとにQPが違っている。 また、VAQ1.0相当のmetric=0では輝度の高い白と右隣の輝度の低い紫に小さなQPが割り当てられているのに対してmetric=3では逆に大きなQPが割り当てられている

Sharktooth版のAQは暗部のブロック歪の対策に重点を置いていていて、そのことがよく表れた結果だが、Dark Shikari版のメリットをはっきり示すには別のサンプルが必要だ、というのが現時点でのまとめ。

なお、MPlayer and MEncoder on MacOSXの解説の通り、x264が表示するSSIMは高速近似計算であって0.01程度の違いは誤差に埋もれてしまう恐れがあるため、 これを使っての比較は困難だ。 この問題は、VAQ2.0のDark Shikari氏も最良の判断はあなたの目で見ることだと言及している。


最後にビットレートとY PSNRのグラフを示す。Sharktooth版で--aq-sensitivity=22とか指定する必要があったのが、VAQでは自動的に適度な閾値になっていることと、VAQ 1.0と2.0では2.0の方が同じビットレートで画質が良い(かも)ということが分かる。
でも、線が左上にいくほど性能が良いという理論通りなら、AQ offが一番高性能になってしまうので、もっと現実的な動画の特徴を持ったサンプルを使った上で、一個の数値尺度ではなくスナップショットを目で確かめることが必要なようだ。

カラーバーのPSNR

関連記事

カテゴリ: DTV
パーマリンクパーマリンク

この記事へのトラックバック アドレス

Trackback URL (right click and copy shortcut/link location)

フィードバックはまだありません...

コメントを残す


Your email address will not be revealed on this site.
(改行が自動で <br /> になります)
(For my next comment on this site)
(Allow users to contact me through a message form -- Your email will not be revealed!)
4月 2024
 << <   > >>
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30        

リンク

最近の記事

アーカイブ

検索

XMLフィード

powered by b2evolution