インテル® VTune™ Amplifier XE パフォーマンス・アナライザーを使って Sandy Bridge EP✝ で特定の LLC イベントをサンプリングする際のパフォーマンスへの影響
この記事は、インテル® ソフトウェア・ネットワークに掲載されている「Performance Impact When Sampling Certain LLC Events on SNB-EP with Intel VTune Amplifier XE Performance Profiler」の日本語参考訳です。
インテル® VTune™ Amplifier XE パフォーマンス・アナライザーを使って、複数ソケットのインテル® Xeon® プロセッサー E5-2600 (コード名: SandyBridge EP) ベースのシステムで以下のイベントのサンプリングを行うと、アプリケーションの実行パフォーマンスに影響します。 以下の 1 つまたは複数のイベントのサンプリング中、(対象のアプリケーションまたは同じシステムで実行しているほかのプログラムの) データロードのレイテンシーが、メモリーからの場合は最大で 10ns、LLC からの場合は最大で 2ns 増加します。この原因はイベントのサンプリング方法にあり、これは全体のパフォーマンスに影響することに注意してください。以下のイベントは正しくカウントされますが、CPI、CPU_CLK_UNHALTED.THREAD、およびレイテンシーに関連するその他の評価基準は、これらのイベントを含むすべてのデータ収集で増加することがあります。
- MEM_LOAD_UOPS_RETIRED.LLC_HIT
- MEM_LOAD_UOPS_RETIRED.LLC_MISS
- MEM_LOAD_UOPS_LLC_HIT_RETIRED.XSNP_MISS
- MEM_LOAD_UOPS_LLC_HIT_RETIRED.XSNP_HIT
- MEM_LOAD_UOPS_LLC_HIT_RETIRED.XSNP_HITM
- MEM_LOAD_UOPS_LLC_HIT_RETIRED.XSNP_NONE
- MEM_LOAD_UOPS_LLC_MISS_RETIRED.LOCAL_DRAM
- MEM_LOAD_UOPS_LLC_MISS_RETIRED.REMOTE_DRAM
これらのいくつかのイベントは、インテル® VTune™ Amplifier XE のインテル® Xeon® プロセッサー E5-2600 向けの「General Exploration (全般解析)」プロファイルに含まれています。このプロファイルの結果は前述の影響を受けますが、アプリケーションのパフォーマンスを明らかにし、潜在的な問題を特定するには有効です。より正確なタイミング情報 (CPU_CLK_UNHALTED) が必要な場合は、「Lightweight Hotspots (ライト hotspot 解析)」の結果を「General Exploration (全般解析)」の結果と合わせて使用してください。
シングルソケットのインテル® Sandy Bridge✝ マイクロアーキテクチャー・ベースのシステムでは、このパフォーマンスへの影響はありません。
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。