AMD HEROES

twitter
facebook
line

32コア64スレッドは乗りこなせるか?第2世代「Ryzen Threadripper」を速攻で試す

文● 加藤勝明 編集●ジサトラショータ

32コア64スレッドという空前にして絶後のスペックを持つ「Ryzen Threadripper 2990WX」。評価キットの中身についてはこちらの記事も参照されたい。ちなみに評価キットに同梱されていたCPUは程々に使用感のあるものだった

日本時間で2018年8月13日22時、AMDは同社のHEDT向けCPU「Ryzen Threadripper」の第2世代ともいえる「Ryzen Threadripper 2990WX(2990WXと略。以下同様)」発売を解禁、同時に秋葉原等では深夜販売も行われた。そして8月31には「Ryzen Threadripper 2950X」の販売も封切られる模様だ。

昨年登場した初代Threadripperは最上位モデル(1950X)が16コア32スレッドであることが話題を呼び、しかもライバルであるインテルの最上位CPU(当時)であったCore i9-7900X(10コア20スレッド)よりもコア数が多く、さらに「米国価格では」安価ということで大きな話題を呼んだ。残念ながらインテルがその後18コア36スレッドの「Core i9-7980XE」を出したことで最強CPUの座からは退いてしまったものの、インテルから奥の手である7980XEを出させた、という意味では1950Xは歴史に残るCPUといえる。

そして今回リリースされる2990WXは、7980XEを上回る脅威の32コア64スレッドCPUである。CCX(CPU Core Complex)を2基つなげたダイをInfinity Fablicでインターコネクトすることで、安価かつ確実にメニーコアCPUを量産化できるというZenアーキテクチャの強みを最大限に発揮させることに成功した製品だ。現在インテルのXeonは最大28コア(こちらはマルチソケット環境前提の製品だが)までしか存在しないため、インテルは前回のように上位CPUをCore i9に降ろして反撃はできない。AMDはいまこの瞬間、HEDT向けCPUとしては他に並ぶもののない、前人未到の領域へ踏み出したのだ。

AMDは今回の第2世代Threadripper製品のターゲットユーザーを2パターン想定しており、米国推奨価格899ドルの2950Xは性能を追求したいエンスージアスト&ゲーマー向け、そして1799ドルの2990WXはクリエイターやイノベーター向けとした。パワーが何より欲しいという点は共通しているが、X付きCPUはホビー寄り、WX付きCPUはプロ寄りの製品ということになるだろう。

気になる国内価格だが、原稿執筆時点では8月31日発売の2950Xは不明だが、発売が封切られた2990WXの初値は23万円程度。“自作ドル円”レートでは1ドル127円、即ち実ドル円レートの15%増し程度の比較的穏当な設定といえるだろう。これもRyzenや先代Threadripperの成功あってこその成果といえる。

筆者は2990WXおよび2950Xのレビュワー向け評価キットを非常に短期間ながら試す機会に恵まれたので、果たして第2世代Ryzenや先代Threadripperをどの程度突き放してくれるのか、ライバルCore i9-7980XEを破り、名目ともに最強CPUになることができるのか、様々なベンチマークを通じて検証していきたい。

AMDの資料で見つけたスライド。第2世代Threadripperのイメージはヘビメタらしい。ヘルをシェイクするような激しいパフォーマンスが期待できるCPUということだろうか

2990WXをタスクマネージャーを見たところ。論理コア数が非常に多いため各コアの占有率は折れ線グラフではなく、数値とマスの濃淡だけで表現されるようになる。すべてのマスを真っ青に染めるような負荷をかけるのが実に楽しい

AMDの資料より抜粋。型番末尾にXのついたモデルはエンスージアストやゲーマー向け、WXのついたモデルはクリエイターやイノベーター、要するにプロ向けの製品であるとのこと

32コア版は4ダイ、16コア版は2ダイ構成

それでは、第2世代Threadripperのスペック部分からチェックしていこう。第2世代Threadripper最大の特徴は、32コア64スレッドの2990WXが4ダイ構成なのに対し、16コア32スレッドの2950Xは2ダイ構成。CCX内の有効コア数を減らして下位モデルを作るのではなく、ダイ数を変えてきたという点は重要だ。

またゲーマー向けである2950Xの基本スペックは1世代前の1950Xとほぼ共通だが、クロックが若干高めに設定されている点も見逃せない。

第2世代Threadripperのスペック。今後登場する2970WXや2920Xについても、WXなら4ダイ、Xなら2ダイと推測することができる

「CPU-Z」で第2世代Threadripperの情報を拾ってみた。右下にあるCoresとThreadsのカウントに注目。エンスー向けとはいえコンシューマー用CPUで32コアが拝める日がくるとは……

ベースのアーキテクチャは第2世代Ryzenと同じく12nmLP(Leading Performance)プロセスの“Zen+”であるため、CPUのクロックブースト周りの機能も第2世代Ryzen準拠となる。即ち「Precision Boost」は「Precision Boost 2」へ、「XFR」は「XFR2」へ……といった具合である。この辺は第2世代Ryzenのファーストレビュー記事を参照していただきたい。さらに第2世代Threadripperでは「Precision Boost Overdrive」にも対応しているが、これは第2世代Threadripper対応BIOSを備えたX399マザーで有効化できる(後述)。

ソケットは従来どおりSocketTR4で、既存のX399マザーの対応BIOSを更新することで動作させることができる。ただし、Zen+になったことでメモリーの最大クロックが最大DDR4-2666からDDR4-2933に引き上げられているので、足回りもやや強化されている。メモリークロックは搭載するメモリーモジュールのランクと枚数により変化する、というRyzenファミリー特有の仕様も共通だが、Ryzenよりもやや制限が緩和されている。

今回はメモリースロット8本にモジュールを4枚追加しての検証だったが、マザー側のXMP(正確にはASUS製マザーのD.O.C.P)を利用してDDR4-2933での動作を確認している。良質なメモリーモジュールを使えば問題ない、というあたりもRyzenと共通のようだ。

第2世代Threadripperがサポートするメモリークロック。メモリーモジュールが4枚ならモジュールのランクは関係なく、8本のメモリースロットを全部埋める時のみモジュールのランクが重要になる。ただ、シングルとデュアルの混在時にどうなるかは名言されていないため、モジュールはどちらかで統一しておいた方がよさそうだ

メモリーの話が出てきたので、CPUの内部構造の話をしておこう。2ダイ構成の2950Xの内部構造は先代Threadripperと同じ。2基のダイそれぞれにメモリーコントローラーが2chずつ接続され、クアッドチャネル動作を実現している。4ダイ構成の2990Xでもこの構造は変わらない。ダイごとにメモリーコントローラーを持たせればオクタチャネル(8ch)メモリーとなり、X399マザーとの互換性が確保できなくなるからだ。

そのため、2990WXの内部トポロジーは以下の図のようになっている。PCI-Express 32レーン分のコントローラーとメモリコントローラー2chを備える“IOダイ”が2基と、外部と直接接触を持たない“コンピュートダイ”2基がInfinity Fabricで相互接続されている。Infinity Fabricの帯域はおおよそ25Gbps(DDR4-3200の場合)あるので十分高速といえるが、IOダイ内のCPUコアの方がコンピュートダイ内のコアよりもメモリーアクセスの点で有利であることは間違いなく、この差異が処理によっては速度に影響し得ることは十分予測できる。

X付きとWX付きモデルの構造の違い。WXにはCPU外部と直接接点を持たないコンピュートダイが2基ある、というのは後述するメモリーアクセスモードを理解する上で重要

ただし32コア64スレッド化の代償として、2990WXのTDPは250Wに到達した。同社の「FX-9590(TDP220W)」、ライバルの「Core i9-7980XE(TDP165W)」も大幅に超えてきたのは驚くしかない(インテルのTDPは算出方法が違ううえに、半ば形骸化した指標である……という点は脇に置いておこう)。ゆえにマザー側のVRM部の設計や冷却手段もこれに対抗できなければならないし、CPUクーラーも相応に強力なものを選択する必要がある。

評価キットに付属の空冷クーラー“Wraith Ripper”。空冷だとこのクラスの大きさが必要になる。しかし、このクーラーを付けるとCPUに1番近いx16スロットが使えなくなるので、今回は使用を見送った

CPUにより異なる動作モード

第2世代Threadripperも全モデル倍率ロックフリーであり、OCのやり方も従来と同様にWindows上で動作する「Ryzen Master」を使うか、古典的なBIOS設定を操作する方法のいずれかで実施できる。そのRyzen Masterも第2世代Threadripperリリースに伴い、「バージョン1.4」へ更新される見込みだ。ただ本稿執筆時点では一般ユーザーがダウンロードできるのはいつからかという確たる情報はないが、今回は評価キットに同梱されたビルドではこうだ、という所をお見せしよう。

基本的インターフェースは従来のRyzen Masterとほぼ同じだ。コア数が多いと不具合の出るソフト用にコア数を減らす“Legacy Compatibilityモード”への切り替え、あるダイからのメモリーアクセスをコントロールする“Memory Accessモード”の設定、そしてCPUのOC関連の設定等の機能を備えている。

第2世代Threadripperに対応したRyzen Master。2990X環境なのでコアがズラッと並ぶのは壮観

CPUのコア部分を展開したところ。各CCXで1番速いコアには★マークが、2番めのコアには●マークが付けられる

まず1番大きな変更点はLegacy Compatibilityモードの細分化だ。16コア32スレッドの2950Xや、先代Threadripperでは従来通り全コア稼働の“ON”、コア数を半減させる“OFF”の2択だが、32コア64スレッドの2990WXでは「OFF」「1/2」「1/4」の3択に増えた。これは「OFF」なら全コア稼働、「1/2」ならコア数が半分に、「1/4」なら4分の1になるというもの。2950Xではオン(1/2モード)しか使えないのは、Legacy Compatibilityモードがダイ単位で有効・無効化するためだ。つまり4ダイ構成の2990WXでしか利用できない。現時点では名言されていないが、現時点では未発売のモデルに関してもこの制約下で動くものと推察される。

ちなみに、コア数を減らしてもOSから認識される物理メモリ量に変化はないが、ダイが1基のみ有効化されるモードではメモリーの動作モードがクアッドではなくデュアルチャネルに格下げされる。

Ryzen Masterのウインドー下部にある“Profile1”または“Profile2”をクリックすれば、Legacy Compatibilityモードの変更が可能になる

2990WXで1/2モードにした状態。Ryzen Master上では下半分のダイが全て“Disabled”になる

同様に1/4モードにすると、左上のダイ以外はすべてDisabledになる

各Legacy Compatibilityモードにおける、第2世代Threadripperの仕様の変化をまとめてみた。1/4モードは4ダイ構成の“WX”付きモデルに限られるようだ

Threadripper特有のメモリアクセスモードも若干変更があった。これまでは各ダイ内のコアは自分のダイに直接接続されたメモリー領域にしかアクセスしない“Local(またはNUMA:Non Unified Memory Access)”モードか、それを気にしない“Distributed(またはUMA:Unified Memory Access)”モードの2種類がある。

先代ThreadripperではDistributedモードがデフォルトだったが、第2世代Threadripperではやや事情が異なる。ダイが2基の2950XはLocalモードがデフォルトで、Distributedモードへの切り替えが可能なのに対し、ダイが4基の2990WXではDistributedモードで固定され、変更はできない。

この違いは冒頭部で解説したターゲットユーザーの違いとCPU内部の設計にある。まず2950Xはゲーマー向けであるため、レイテンシー的に有利なLocalモードをデフォルトにしたのだろう。これに対し2990WXでは2基のコンピュートダイは隣接するIOダイを経由してメモリーにアクセスせざるを得ないため、Localモードは意味をなさないからだ。また、2990WXでコア1/2モードや1/4モードでも、メモリーアクセスモードを変更することはできない。

2990WX(左)ではメモリーアクセスモードの切り替えUIは常時“N/A”となるのに対し、2950X(右)では“D(Distributed)”と“L(Local)”の2択になる

そしてもう一つ、このバージョンから第2世代Threadripperに搭載された「Precision Boost Overdrive」がUI上で設定可能になった点にも触れておきたい。第2世代Ryzenの新機能として紹介され、X470マザーのBIOSで先行的に実装された製品もあるものの、AMDはRyzen Masterが必要と謳っていた。その機能がバージョン1.4のRyzen Masterでようやく解禁になったのだ。Ryzen 7 2700Xにおける検証記事で明らかな通り、クロックが微妙に上がるだけなので必須機能とは言えないが、少しでも性能を絞り出したい人には歓迎すべき変更といえる。

ただしRyzen Masterで設定できるのはPrecision Boost Overdrive有効時に操作できる3つのパラメーターだけで、Precision Boost Overdrive自体の有効・無効化はできない点に注意したい。

ウインドウの中盤に位置するこの部分がOCとPrecision Boost Overdriveに関係する関係。中央の“Precision Boost Overdrive”を選択すると、PPT/TDC/EDCの3パラメーターを変更することができる

BIOSレベルでPrecison Boost OverdriveをDisableにすると、Ryzen Masterの上部に表示されるPPT/TDC/EDCの表示が消える

↑Precision Boost OverdriveをAutoもしくはEnableにすると、このような表示になる。図ではCINEBENCH実行中にPPT250Wの枠を使い切ったということで赤表示になっている

“Manual”ではPrecision Boost Overdriveの手動設定ではなく、コアのクロック調整が可能になる。+とーのボタンを押してコア単位でクロックを微調整できるほか、CCX表記の部分をクリックすることでCCX(4コア)いっぺんにクロックを上げ下げできるようになる。もう少し分かりやすくして欲しいところだ

検証環境は?

ベンチマーク検証に入る前に、今回のテスト環境を紹介しよう。先代Threadripperから最上位の1950X、メインストリーム向けのハイエンドRyzen 7 2700Xをベースラインとし、2990WXおよび2950Xのパフォーマンスを比較する。また、インテル側のHEDT向け最強CPUであるCore i9-7980XEも準備した。ただしこのCPUはイッペイ氏の私物であり、殻割りのうえ液体金属グリスを塗布してあるので、微妙に性能が高く出る可能性がある(とはいえ定格運用なので差は微々たるものだろう)。なお、Ryzebおよびi9のテスト環境はCPUとマザーボードを除きhreadripper検証環境と同一だ。

X399マザーのBIOSは評価用に配布されたバージョン“0064(7月28日付け)”を使用した。メモリーは各プラットフォームで使いまわしているが、メモリーの動作クロックは各CPUがサポートする最大値に合わせている。即ち2950X/2990WX/2700XはDDR4-2933、1950Xおよび7980XEはDDR4-2666となる。

また、Precision Boost OverdriveについてはサポートしているCPUについてはBIOS上でEnableとしたが、細かいパラメーターについてはマザーのデフォルト値(もしくはAuto)設定とした。Precision Boost Overdrive使用により消費電力は上がってしまうが、今回は手動のOCなしでどこまで性能に差がつくかを見てみたい。

そして、性能に大きく響きそうなThreadripperのLegacy Compatibilityモードは2950Xと2990WXのみ測定、逆に先代Threadripperで影響が軽微であったメモリーアクセスモードについてはデフォルト設定のままとした。

検証環境:Threadripper
CPU AMD Ryzen Threadripper 2950X(16C32T、3.5GHz〜4.4GHz)、AMD Ryzen Threadripper 2990WX(32C64T、3GHz〜4.2GHz)、AMD Ryzen Threadripper 1950X(16C32T、3.4GHz〜4GHz)
マザーボード ASUS ROG ZENITH EXTREME(AMD X399、BIOS 0064)
CPUクーラー Enermax ELC-LTTR240-TBP(簡易水冷、240mmラジエーター)
メモリー G.Skill F4-3200C14D-16GFX×2(DDR4-2933または2666で運用)
グラフィックスカード NVIDIA TITAN V
ストレージ Samsung MZ-V7E500B/IT(NVMe M.2 SSD、500GB)
電源 Silverstone SST-ST85F-PT(850W、80PLUS Platinum)
OS Windows 10 Pro 64bit版(Fall Creators Uptade)
電力計 ラトックシステム REX-BTWATTCH1
検証環境:Ryzen
CPU AMD Ryzen 7 2700X(8C16T、3.7GHz〜4.3GHz)
マザーボード GIGABYTE X470 AORUS GAMING 7 WIFI(AMD X470)
検証環境:Core i9(インテル)
CPU Intel Core i9-7980XE(18C36T、2.6GHz〜4.4GHz)
マザーボード ASUS ROG RAMPAGE VI EXTREME(Intel X299)

スコアーも凄いが、消費電力も凄い

CPUの性能比べといえばまず「CINEBENCH R15」だろう。32コア64スレッドの2990WXがどこまでスコアーを伸ばし、2950X対1950Xの16コア32スレッド対決はどちらが勝つのか、そしてLegacy Compatibilityモードでコア数を減らすとスコアーにどう影響するのか……などの要素をチェックしていきたい。

「CINEBENCH R15」のスコアー

2990WX全コア稼働時のスコアーはただ驚愕。Precision Boost OverdriveをDisableにすると5000ポイントをわずかに下回る程度だが、Enableにすると5600ポイントオーバーになった。シングルスレッドのスコアーは169ぽいととやや控えめだが、それでも1950Xを超え2700Xに迫る。シングル性能を犠牲にせずここまでマルチスレッド性能を伸ばした点は驚異的だ。

そしてLegacy Compatibilityモードを1/2にすれば1950Xよりやや速く、1/4にするとほぼ2700Xと同等になること、さらにコア数を減らすほどシングルも徐々に伸びる傾向が見られるのは非常に面白い。コア数を増やせば増やすほど、熱や電力の制限が厳しくなることを示唆している。

だがそれ以上に衝撃というべきは、16コア32スレッドの2950Xが18コア36スレッドの7980XEをマルチスコアーで上回っているという点だ。シングルスレッドの速さはインテルの強みで、これが破られなかったのは少々残念だが、それでも2950Xのシングルは176、1/2モードで178ポイントと7980XEの背中にピッタリと付けている。

もっとも、第2世代ThreadripperのスコアーはPrecision Boost Overdrive込みのスコアーなので、若干OCして下駄を履いているとも言えるが、ここで1番大事なのは「16コア」が「18コア」に勝ったという点。2990WXのスコアーの凄さよりも、こちらの方が重要である。

また、2990WXの1/4モードおよび2950WXの1/2モードのスコアーが2700Xのそれに非常に近いという点は、性能をスケーラブルに伸ばしていけるAMD製CPUのもう一つの強みが現れているといえるだろう。

おおよその馬力がわかったところで消費電力もチェックしよう。HEDT向けCPUを使っている時点で消費電力に一喜一憂するのは野暮の極みだが、ワットパフォーマンスを完全無視する訳にもいかない。

今回はシステム起動10分後の安定値を“アイドル時”、「OCCT Perestroika v4.5.1」の“CPU Linpack”テスト(64bit/AVX/全論理コア使用)を最低15分稼働させ、その間のピーク値を“OCCT時”とした。

システム全体の消費電力(W)

Precision Boost OverdriveをEnableにした第2世代Threadripperの消費電力はかなり高く、特に全コア稼働時の2990WXの消費電力は凄まじい。ところがコア数を減らして1ダイ構成にすると、2700Xより少々大きい程度に収まる。2700Xよりやや消費電力が増えている点は、単純にX399マザーの設計や装備等でベースの消費電力が高くなっている点と、1/4モードで無効化されたダイも最低限の回路で動かしているからと推測できる。

ちなみに、Precision Boost OverdriveをDisableにすれば、2990WXでもMax450W程度に収まる。これをマトモにOCするとなれば、1000Wクラスの電源ユニットが必要になることは確実だろう。

2990WX最強説を唱えるのは早計?

ここからは実アプリでのパフォーマンス類をチェックしていくが、最初に総合ベンチマーク「PCMark10」のスコアーを比べてみたい。HEDT向けCPUで使うには負荷の低いめのベンチマークではあるが、一応試してみた。テストは全ワークロードを試す“Extended”テストを使用し、総合スコアーだけでは分かりにくいので各テストグループ別のスコアーも比較する。

「PCMark10」Extendedテストのスコアー

「PCMark10」Extendedテストにおけるテストグループ別スコアー

2990WXの全コア稼働時のスコアーがない理由は、この設定時のみPCMark10実行中にPCごと落ちるためだ。具体的にはDCC(Digital Contents Creation)テストグループの終盤、POV-Rayでのレンダリングテストを実行する際に決まって発生する。新ハードのファーストレビューはトラブルがつきものだが、今回のはなかなか見られないトラブルだ。

それ以外の結果は割と素直だ。2990WXも1/2モードにすれば完走し、これはほぼ2950Xの全コア稼働時の結果に等しく、コア数が等しい1950Xよりもスコアーが高い。ZenからZen+へアーキテクチャーを移行させた効果はThreadripperでも有効のようだ。

PCMark10のPOV-Rayテストで2990WXが不具合を起こすのであれば、他のレンダリング処理はどうだろうか? まずは「V-Ray Benchmark v1.0.8」を利用してレンダリング時間を比較する。

「V-Ray Benchmark v1.0.8」の処理時間(CPUのみ)

このベンチでは2990WXの全コア稼働でも問題なく完走できた。CINEBENCHのような爆発的な差は付かなかったが、全コア稼働状態でわずか23秒。コア数を減らしていくと2950Xや2700Xといったコア数の同じCPUの結果とほぼ同じになるという点も共通している。このテストでは7980XEが2950Xを僅差で抜き去り一矢報いた結果になったが、価格的には2950Xの方に大きなアドバンテージがある。約900ドルの2950Xの価格が、1ドル130円の無茶な為替レートであったとしても12万円。これが実売22万円前後の7980XEとほぼ拮抗している。2950Xのコスパは驚異的だ。

もう一つCGレンダリング系ベンチとして「Blender」を利用した“Cycles Benchmark”も試してみた。いくつかシーンごとに試せるようになっているが、今回は特に負荷の高いこの記事からDLできるシーン“Berbershop”をCPUだけでレンダリングする時間を比較する。

「Blender」を利用した“Cycles Benchmark”の結果(CPUのみ)

CINEBENCHやV-Rayよりも長時間演算し続けるベンチだが、2990WXは問題なく完走でき、素晴らしい結果を残している。CGレンダリングをやるなら、2990WXは無敵の存在といってよいだろう。2950Xでも1950Xより若干速いといった点もV-Rayと共通している。

とは言え、7980XEもBlenderでの処理効率はかなり高い。1950Xはもちろん、2950Xにも30秒程度の差をつけて勝っている。Blenderは18コアの方が12コアCPUよりも高速だった、という話だ。

クリエイター向けのCPUパワーを食う処理といえば動画エンコードがある。そこで4K動画4つを「Premiere Pro CC 2018」を利用してタイル状に並べ、再生時間約1分の8K動画にまとめ、それを「Media Encoder CC」を利用してH.264形式の8K動画に書き出す時間を比較する。ビットレートは50Mbps、2パスVBRでエンコードを行った。

「Premiere Pro CC 2018」で編集した動画を「Media Encoder CC」で8K動画にエンコードする時間

このテストではおかしなことに、32コア64スレッドの2990WXが、16コア32スレッドの1950Xより遅いというにわかに信じがたい結果が出た。そしてコア数で並ぶ2950Xと1950Xとの比較においても、アーキテクチャー的に新しい2950Xの方が負けている始末。CGレンダリングではあれだけ速いのに、動画エンコードではなぜか第2世代Threadripperは遅いのだ。

そしてここでの最速は7980XEである。インテル製CPUに最適化されているといえばそれまでだが、2990WXと2950Xの順位がおかしいのは非常に気になるところだ。

釈然としないので別のエンコードソフトでも試してみよう。今回はフリーで利用できる「Handbrake」を利用した。4Kでゲーム画面を録画した再生時間約5分のMP4ファイルにデノイズ処理をかけつつフルHDに縮小、10Mbpsの2パスVBRで書き出す時間を計測した。コーデックはx265を利用している。

「Handbrake」を利用した動画エンコード時間

少し処理を重くしすぎたせいか、思いのほか時間がかかってしまったが、このテストでもMedia Encoder CCでのエンコード結果と似た傾向の結果が得られた。まったく理解に苦しむが、今回これを解決する時間は得られなかったのが残念だが。現段階で考えられる原因としてはBIOSの熟成不足、評価用CPUまたはマザーの不具合、発熱とサーマルスロットリングが疑われるが、それについては後ほど再検討するとしよう。

CPU占有率という面ではかなり軽いが、RAW現像処理も試してみたい。ここでは「Lightroom Classic CC 2018」を使用する。解像度6000×4000ドットのRAW画像200枚(NEF形式)を読み込み、レンズ補正等の簡単な補正を加えた後DNG形式に変換、それをそのまま最高画質のJPEGファイルに書き出すという2つの処理時間を計測した。JPEGに書き出す際にシャープネス処理(スクリーン向け、適用量“標準”)を付与している。

「Lightroom Classic CC 2018」を利用した200枚のRAW画像処理時間

このテストでも2990WXの処理速度は遅い。特に全コア稼働状態だとパフォーマンスが著しく低下するが、コア数を減らすと大きく改善する。改善したとしても1950Xに及ばないのはエンコード処理と同じだが、極めて理解しがたい挙動だ。発熱やサーマルスロットリングが原因でなければ、メモリーアクセスパターンが問題なのだろうか?

だが、負荷の高いBlenderではしっかり結果を出しているのでサーマルスロットリング説は考えにくい。エンコードや画像処理時に特異な処理のパターンが原因といえそうだ。

ゲーミングでは32コアは足かせになる

次にゲーミング性能をチェックしてみよう。特に2950Xはゲーマー向けのCPUとして利用に耐えるものなのだろうか?

手始めに定番「3DMark」のスコアーを比較してみよう。このベンチはテスト毎にCPUをフル活用したPhysics(物理演算)テストが入るし、GraphicsテストでもCPUのパフォーマンスが影響してくる。Fire Strike/Fire Strike Ultra/Time Spy/Time Spy Extremeの4つのテストを実施した。

「3DMark」のスコアー

2990WXは全コア稼働時のスコアーが異様に低いが、コア数を2950Xや1950Xと同じ16コアに減らす(1/2モード)と急激にスコアーが上がる。64基も論理コアがあると各コアの負荷が分散しすぎて効率が悪くなる、あるいはコンピュートコアに入ったデータが外部にアクセスする際のパフォーマンスがよくないことが示唆されている。

また、2990WXの1/2モードではどのダイが無効化されるか明言されていないが、外部に繋がるIOダイを真っ先に無効化するとは考えにくい。つまりコンピュートダイを無効化した結果、スコアーが伸びたと考えるのが自然だ。2950Xも2990WXも、16コア32スレッドでは1950Xよりやや上、8コア16スレッドでは2700Xより上のスコアーが出ているなど、クロックやアーキテクチャーが進化した分僅差だが性能が向上している。

では実ゲームベースの検証もしてみよう。まずはマルチスレッド化がかなり進んでいる「Assassin’s Creed: Origins」を使用する。解像度は1920×1080ドットに固定し、画質は“中”および“最高”の2通りとした。内蔵ベンチマーク機能を用いて平均fpsを比較しよう。

「Assassin’s Creed: Origins」の平均fps

このゲームは6〜8コアCPUで動かすと全論理コアを均等に使ってくれるのだが、さすがに今回のようなメニーコアCPUだと、使われないコアが多数出てくる。全コアフル稼働状態の2990WXではフレームレートが著しく低下する。しかし1/2や1/4モードを選択することで、1950Xにかなり近いパフォーマンスが得られた。だが1/2や1/4モードでゲームをすることを考えれば、最初から2950Xを買う方が幸せになれることは間違いない。AMDが2990WXのターゲットユーザーを“クリエイター&イノベーター”と主張しているのは、全コアフル稼働状態のパフォーマンスに問題があるからだろう。

CPU負荷のあまり高くないゲームでも試してみよう。そこでもはや定番と化したPUBGこと「PLAYERUNKNOWN’S BATTLEGROUNDS」で試してみた。解像度は1920×1080ドット、画質は“ウルトラ”固定とし、リプレイデータ再生時のフレームレートを「OCAT」を利用して計測した。

さらにメガタスク状態でのパフォーマンスも見るために、PUBGの背後で「Xsplit Broadcaster」を動かし、Twitch配信とローカルへの録画を同時に行う。さらにXsplit上でPUBGの画面の上にプレイヤーのWebカム画像を切り抜き合成するという処理も加えた。切り抜きには「Tridef SmartCam」を利用している。配信の画質設定は5000kbps、録画画質は“Very High”とした。

「PLAYERUNKNOWN’S BATTLEGROUNDS」フルHD、単体実行時におけるフレームレート

「PLAYERUNKNOWN’S BATTLEGROUNDS」実行中にXsplitによるTwitch配信と録画を並行して実施した時のフレームレート

2990WXの全コアフル稼働ではフレームレートが劇的に悪化するが、1/2や1/4モードになると性能が復活する。特にPUBGでは2700Xに近いどころか、最低fpsで上回る。ダイの少ない2950Xはデフォルトのままでも良好な性能で、ゲーマー向けモデルと謳われるのも納得の性能だ。さらに7980XEをフレームレートで大きく上回っている点も見逃せない。1950Xの時点でほぼ同等、Zen+ベースになった2950Xで完封と言ってよいだろう。

ただXsplitとTriDefによる処理を同時に行った場合は、少し面白い傾向が見えてくる。2990WXの場合全コア稼働より1/2モードの方がフレームレートが上がる点は同じだが、1/4モード、即ち8コア16スレッドで稼働させるとふたたび極端にフレームレートが低下するのだ。

エンコードだけなぜ遅い?

以上の検証でわかった通り、2990WXはCGレンダリング系では最強であることは疑いのない事実だが、動画エンコード系では前世代の1950Xより遅いという結果も出している。その理由は何なのかについてもう少しデータを集めてみたい。

まず考えられるのは、何らかの理由でクロックが上がらないから遅いということ。そしてその第1原因として考えられるのはCPUの発熱だ。TDP250WのCPUがフル稼働した時の温度はかなり高いはず、ということでBlender(レンダリング)とMedia Encoder CC(エンコード)のテストを実行した時に、2990WXの動作クロックと温度を「HWiNFO」で追跡・比較してみる。エンコード時は温度が極端に高くなり、サーマルスロットリングが発生し処理が遅くなったのではないかという仮説を立てた。

BlenderとMedia Encoder CCを選択した理由は、Blenderは1950Xよりも2990WXの方が速く、Media Encoder CCでは1950Xの方が速く、さらに処理終了までどちらも15分〜20分程度かかる。これならCPU温度はしっかりと上がってくれるはずだ。

以降のグラフでは、BlenderおよびMedia Encoder CC実行中におけるCPUのダイ温度と、クロックの推移を掲載する。ただ第2世代Threadripperはコア数が多いため全部グラフに詰め込むと見辛いため、クロックは全物理コアの平均値、Tdieは4基のダイのうち1番高いもの比較することにした。

まずは1/2モード、すなわち16コア32スレッドCPUとした時のTdieとクロック推移を見てみよう。

2990WX、16コア運用時(1/2モード)におけるクロック(16コアの平均値)の推移

まずクロックの推移だがBlender処理中では3.8GHz前後、これに対してMedia Encoder CC処理中は4GHzよりやや上をフラフラしている。クロックの中盤にある大きな谷はエンコードの1パスめと2パスめの切り替わりを示している。先程の仮説では処理の遅いMedia Encoder CCの方がクロックが低くなるべきだが、現実は高かった。

2990WX、16コア運用時(1/2モード)におけるTdie(最大値)の推移

そしてこちらはCPUのTdieの推移だ。Blender処理時はゆるやかに上昇する傾向が見られるのに対し、Media Encoder CCは処理の負荷の波に合わせて温度がスパイクのように跳ね上がる。Tdieの値は高い時で75℃を超えるが、高温状態は一瞬で終わる。Media Encoder CCの方が温度変動が激しいが、クロックも高いことから、処理の負荷そのものはBlenderよりも低め、逆にBlenderは密度の濃い処理を連続して行うためにクロックが抑えられていると考えられる。そして処理が(1950X等に対し)高速なのはBlender。Media Encoder CCの処理が遅いのは温度が高いからではなく、処理の効率が上がってないからだと推測できる。

同様に32コア64スレッドフル稼働状態でのTdieとクロックも比較しよう。

2990WX、全コア運用時におけるクロック(32コアの平均)の推移

2990WX、32コア運用時におけるTdie(最大値)の推移

全コア稼働状態においても、Media Encoder CCで処理している時の方がBlender時よりもクロックが高く、さらにTdieも低めで安定している。特にTdieは16コア時よりもずっと低い。Tdieの低さが今回の現象を解き明かす鍵になりそうだ。

そこでCPUの“Package Power”なるパラメーターの推移もチェックしてみよう。CPUパッケージが消費している電力を電力や電圧の情報から産出したもので、これが多ければ当然仕事を沢山していると推測できる。

2990WXのCPU Package Powerの推移

このグラフでは2990WXの16コア稼働時と32コア稼働時をすべて同じグラフに入れて観察している。最初1分程度は数値がゴチャッとしているが、前処理をしている領域をすぎれば一気に数値が上がり、ほぼ横ばいを維持しながら計測終了時点までそれが維持される。

そしてBlender処理時に比べ、Media Encoder CC処理時の方が若干CPU Package Powerが低い。全コアフル稼働時の方が16コア稼働時よりも低くなっているのだ。あえてCGレンダリングと動画エンコード処理の重さを同列に語るならば、現状のMedia Encoder CCはBlenderに比べメニーコアCPUの扱いがやや下手なのかもしれない。

マザーボードの熱対策が急務

最後にハイエンドCPUの泣き所ともいえる発熱にフォーカスを当てる。前述の通り2990WXの高負荷時の消費電力はPrecision Boost Overdrive込みで600〜700Wと非常に大きく、TDP250Wの凄さを思い知らされた。

だが第2世代Threadripper、特に2990WXを運用する場合はCPUよりもマザーボード側の対策が急務となる。消費電力の測定にはOCCTのCPU Linpackテストを用いたが、2990WXの全コア稼働状態でOCCTを回すと、実は10分持たずにPC自体が落ちてしまう。原因はどうやらマザーのVRM温度が関係しているようだ。

そこで同じくHWiNFOを使いTdieとVRM温度を追跡してみた。原稿執筆時点のHWiNFOはROG ZENITH EXTREMEの温度センサー情報が一部不完全な状態で出力するが、マザーのユーティリティーの温度とHWiNFOの“Temperature6”が近いため、これがVRM温度と推測して追跡してみた。

室温24℃の環境で、CPUクーラーに簡易水冷を使ったバラック組み同然の環境なので、CPUソケット付近にはほとんど気流はない。一応マザーのIOシールド内に小さなファンが内蔵されており、負荷がかかると強制冷却がかかるが、1基では力不足なのは確かだ。マザーのオプションとしてVRM冷却用パーツというか、小さなファンと固定するステーのセットも用意されているが、今回は雑に、12cmファンをVRMのヒートシンクの上にかぶせ、ファンがない状態とどう変わるか比較することとした。さらに比較対象として、2990WXの1/2モード時および2950Xも準備。もちろんこの2つはVRMの追加ファン無しで計測する。

VRM部に何も対策しない状態と、写真のように12cmファンの風をヒートシンク付近に当てることで、VRM温度やシステムの安定性に違いがあるか検証する

OCCTで超高負荷をかけた時のVRM温度の推移

まず全コア稼働状態で、何のファンも追加しないと、あっという間にVRM温度が100℃を超える。最終的には115℃を記録したすぐ後に、PCそのものが落ちた。一度落ちるとメインパワーを切り、少し冷やすまで再起動すらできない状況になる。

だがファンを追加することで、OCCTのCPU Linpackも十分長い時間持続するようになった。VRM温度は94℃とかなり高いが、VRM部にファンの風を当てるだけで、システム全体の安定性が担保される。同じ2990WXでも実働コア数を16コアにすれば、追加ファンがなくてもキッチリOCCTは回る。2950Xの温度の方がやや高いのは、動作クロックが微妙に高く設定されているせいだと思われる。2990WXをこれから買おうと考えている人は、マザーのVRM部の冷却を見直すべきだろう。

サーモグラフィーカメラ「FLIR ONE」を利用して、VRMを裸で使った時とファンを置いた時の表面温度の違いを比較してみた。VRM冷却をしない状態では、VRM表面温度が74℃あたりでPCが強制的に落ちるのに対し、ファンを置くだけで12〜13℃も表面温度が低下した(前掲のグラフによれば、センサーで検知できる温度はそれ以上低下している)。

VRM冷却を何も考えてない状態のヒートシンクの表面温度。この写真は前掲のグラフのデータとりと並行して撮影している。表面温度の最大値は74℃を超えたが、PCが落ちたのを見てから慌ててシャッターを切ったため、写真では73℃付近になっている
VRM部にファンを置くだけで、高負荷時のVRM温度を劇的に下げることに成功した

良くも悪くも“紙一重”のCPU

以上で第2世代Threadripperの検証は終了だ。コンシューマーで使える初の32コア64スレッドCPUはとても心踊らされるが、同時に超々ハイエンドならではの扱いの難しさも実感した。2990WXはCGレンダリングのような処理では凄まじく強いが、動画エンコードでは良い結果を出せないという後味の良くないテスト結果になったのは極めて残念だ。今回入手した検証機材由来のトラブル、BIOSそのものの熟成不足、ソフト側の最適化の問題……もちろん筆者がなにかミスをしたことも十分に考えられる。全コア稼働時にゲームのパフォーマンスが著しく低下するなど、これまでのCPU運用の感覚で手をだすと使いこなせずに終わる可能性もある。

これに対し2950Xは扱いやすい印象を受けた。エンコード処理等では1950Xに負けるシーンも見られたが、2990WXほどの絶望的な差はつかない。ゲーミング性能に関しても、特にPUBGでは7980XEよりも安定したフレームレートが得られる点は素晴らしいと言える。

以上のことから、発売前夜の時点では、このCPUは万能であるとは言い難い。切れ味は鋭いが、使い方を誤ると全く切れないナイフのよう。第2世代Threadripperは使い手と波長があえば神クラス、そうでなければ……という“紙一重”のCPUといってよいかもしれない。

この記事もおすすめ

PAGE TOP