効率良い並列化
この記事は、インテル® ソフトウェア・サイトに掲載されている「Efficient Parallelization」の日本語参考訳です。
はじめに
ここでは、並列化について説明します。さまざまな並列化手法および最適な並列パフォーマンスを達成するためのヒントや手法へのリンクを提供します。
目標
ここでは、インテル® コンパイラーとともに提供されるインテルの OpenMP* ランタイム・ライブラリー、インテル® MPI、インテル® Cilk™ Plus、インテル® スレッディング・ビルディング・ブロック (インテル® TBB) 向けの手法を紹介します。
トピック
以下のトピックで、並列化について詳しく説明します。リンクをクリックすると、そのトピックが表示されます。
-
-
インテルの OpenMP* ランタイムを使用したスレッド・アフィニティーの制御
-
まとめ
ここでは、さまざまな並列化手法について説明しました。OpenMP* については、スレッド・アフィニティーの制御と OpenMP* スケジューリングの制御という 2 つの重要なパフォーマンスを引き出す手法を紹介しました。
次のステップ
この記事は、「Programming and Compiling for Intel® Many Integrated Core Architecture」 の一部「Efficient Parallelization」の翻訳です。インテル® Xeon Phi™ コプロセッサー上にアプリケーションを移植し、チューニングを行うには、各リンクのトピックを参照してください。アプリケーションのパフォーマンスを最大限に引き出すために必要なステップを紹介しています。
「ベクトル化の基本」では、効率的なベクトル化を行うための最適な手法とコードのベクトル化を支援する手法について説明します。