※この記事はASCII.jpからの転載です(文中リンクはASCII.jpの記事に飛ぶことがあります)
Ryzen Threadripper 3990Xのパワーが活きない場合とは
もうひとつCG系アプリとして「Houdini Apprentice」もチェックしてみよう。このアプリの用途のひとつに、粒子の挙動を物理演算でシミュレートするものがあるが、これは粒子の数が増えるほど計算負荷が高まる。演算にはCPUを使うのでRyzen Threadripper 3990Xはうってつけのソリューションに思える。
今回はXeon W-3175Xレビュー時に使用したプロジェクトを利用する。粒子のpoint数は49万弱、最初のフレームから120フレーム後の様子をプレビューさせた時間を内蔵パフォーマンスモニターを利用して計測した。
Houdini Apprenticeでもプロセッサーグループの壁は越えてくれるが、128スレッドをフル活用しようとすると、むしろ遅くなる結果が出たことは興味深い。PBOを有効にしてOCすると処理時間が短縮されるが、それよりもSMTをオフにした方が早くなる。つまりプロセスを分割しすぎると逆にそれがオーバーヘッドになって、性能が下がってしまうことが示されている。
前回動画エンコード系代表として「Media Encoder 2020」を利用し、H.264の4Kのエンコードで検証したが、その際にプロセッサーグループ内の64スレッドでも使い切れず、同じソースで4つパラレルで書き出してようやく64スレッドをフルで使えると示した。
今回は「DaVinci Resolve Studio 16」で検証しよう。8KのRED RAW動画で構成された約2分半のシーケンスを準備し、それを1本の8K(7680×4320)動画に書き出す時間を計測する。ファイル形式とコーデックは定番のMP4&H.264に加え、MXF OP1a&DNxHR 444の2通りで検証した。
タスクマネージャーで観測できるCPU負荷はプロセッサーグループ0(ヒートマップの上半分)に集中しているものの、128コア全てにうっすらと負荷がかかっていることが確認できるが、これはカラーグレーディングやフィルター処理にGPUをかなり活用(タスクマネージャーのGPU負荷のグラフに注目)しているため。弱い負荷だけかかっているコアはGPU側に処理させるために使われているようだ。
つまりこの検証ではRyzen Threadripper 3990Xのパワーは有効活用できていない。SMT有効時のRyzen Threadripper 3990Xの方が遅いが、これもHoudini Apprenticeと同様にオーバーヘッドが足を引っ張っているからと考えられる。
もうひとつ動画エンコード系として「Handbrake」でも試してみた。再生時間約5分の4K動画をプリセットのプロファイル「Super HQ 1080p30 Surround」および「H.265 MKV 2160p60」を利用してそれぞれM4V/MKV形式に書き出す時間を計測した。
PBO有効時は熱の問題が発生するのか、Ryzen Threadripper 3990Xの定格時よりも若干遅くなっているが、定格時よりもSMTを無効にした時のほうが高速というのはDaVinci Resolve Studioと共通している。プロセッサーグループの壁を越えることのできたH.265のエンコード処理はさぞ高速か……と思いきや、Ryzen Threadripper 3990Xが3970Xより確実に速いとはいえない程度の差しかない。プロセッサーグループの壁を越えることができても、スレッドを128に分割する意義がなければ、高速化しないということだ。