インテル® VTume™ Amplifier XE 2015 におけるインテル® Xeon Phi™ コプロセッサー向けコールスタック・イベントベース・サンプリング
この記事は、インテル® デベロッパー・ゾーンに掲載されている「Event-based sampling with Call stack for Intel® Xeon® Phi™ is coming in VTune™ Amplifier XE 2015」の日本語参考訳です。
インテル® VTune™ Amplifier XE 2013 は、以下の解析タイプを使用してインテル® Xeon Phi™ コプロセッサー上でパフォーマンス・データの収集をサポートしていました:
- knc-hotspots
- knc-general-exploration
- knc-bandwidth
スタック・サンプリング(オプション)は、利用できませんでした。次のコマンドを使用して確認できます:
# amplxe-cl -help collect knc-general-exploration
次のコマンドで、インテル® Xeon® プロセッサー向けのこれまでのサンプリングと比較できます:
# amplxe-cl -help collect general-exploration
“knob” オプション enable-stack-collect が表示され : デフォルトで “false” である値を “true” に設定できます。
– もしくは –
#amplxe-cl -help collect advanced-hotspots
“knob” オプション collection-detail が表示され : “hotspots-sampling”、”stack-sampling”、もしくは “stack-and-callcount” に設定できます。
インテル® VTune™ Amplifier XE 2015 を利用すると、knob オプション “enable-stack-collect” と “collection-detail” は、まだ利用可能であり、コツスタック付サンプリングを行うために使用できます。次に例を示します:
# amplxe-cl -collect advanced-hotspots –target-system=mic-native -knob collection-detail=stack-sampling –search-dir sym:p=.– /root/omp_pi.MIC
Limitation: call stack feature is not ready if your application is “offload” from the host.
(制限: アプリケーションが、host から “オフロード” を行う場合、コールスタック機能は利用できません。)
# amplxe-cl -collect advanced-hotspots –target-system=mic-host-launch -knob collection-detail=stack-sampling –search-dir sym:p=.– ./offload_pi
amplxe:Using target: mic-host-launch:
amplxe:Error:Collection with stacks and call counts is not supported for offload applications on Intel Xeon Phi coprocessor.
(エラー:インテル® Xeon Phi™ コプロセッサー上にオフロードされたアプリケーションでは、スタックと呼び出しカウントの収集はサポートされていません)
注意:
- 2013 バージョンにおける “knc_” プリフィックス解析タイプは利用できますが、コールスタック機能はサポートされません。
- インテル® Xeon Phi™ コプロセッサー上の “Call stack” は、CPU_CLK_UNHALTED と INSTRUCTIONS _EXECUTED イベントのみに適用されます。
- “Call count” 機能は、インテル® Xeon Phi™ コプロセッサーでは利用できません。
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。