インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャー向けプログラミングとコンパイル
このページでは、「Programming and Compiling for Intel® Many Integrated Core Architecture」 の参考訳を掲載しています。
- インテル® MIC アーキテクチャーの準備
- インテル® コンパイラーの基本的な使用方法
- コンパイラーの基本的な使用方法 (https://software.intel.com/sites/default/files/managed/f0/24/4.1-cilkplus-vectorization.pdf (英語)) (quicklabs.tgz)
- コンパイラーのプラグマ/ディレクティブ
- 効率良い並列化
- ベクトル化の基本
- インテル® Cilk™ Plus の配列表記 (アレイ・ノーテーション) と要素関数を使用する C/C++ ユーザー向けのベクトル化 (https://software.intel.com/sites/default/files/managed/f0/24/4.1-cilkplus-vectorization.pdf (英語))
- ガイド付き自動並列化 (GAP)
- Fortran の配列データおよび引数とベクトル化
- ベクトル化および最適化レポート
- ベクトル化の可能性を高めるデータ・アライメント
- ポインター・エイリアシングとベクトル化 (https://software.intel.com/sites/default/files/managed/01/07/4.4-pointer-aliasing-and-vectorization.pdf (英語))
- 外部ループのベクトル化
- インテル® Cilk™ Plus の配列表記 (アレイ・ノーテーション) による外部ループのベクトル化 (C/C++ ユーザー向け)
- 配列表記のトレードオフ (C/C++ ユーザー向け)
- ベクトルのフル活用と -opt-assume-safe-padding オプションの使用
- 乱数を使用するループのベクトル化
- 手動によるループアンロールの回避
- 一般的なベクトル化のヒント
- インテル® MIC アーキテクチャー向けの高度な最適化
- 浮動小数点モデル – パフォーマンス、精度、再現性のバランス (英語)
- 浮動小数点モデル – インテル® XeonR とインテル® MIC の違い (英語)
- 精度を下げて最適化
- インテル® MIC アーキテクチャーでのプリフェッチ (英語) Updated!
- -opt-threads-per-core コンパイラー・オプションを利用したコアあたり 1-4 スレッドのスケジュール Updated!
- インテル® MIC アーキテクチャーのストリーミング・ストア (英語) Updated!
- gatherhint/scatterhint 命令の選択的使用
- メモリー割り当てとファーストタッチ
- データの移動と初期化: 最適化および制御 (英語)
- ネイティブおよびオフロードのプログラミング・モデル
- インテル® Xeon Phi™ コプロセッサー向けネイティブ・アプリケーションのビルド
- ヘテロジニアス・プログラミング・モデル
- インテル® C++ コンパイラーのオフロード機能を効率良く使用するには
- 新しい MIC Offload 機能のホワイトペーパー (C++、Fortran) (英語)
- 新しい MIC Offload 機能 (C++ 、Fortran)
- クロスコンパイルの課題 (英語)
- ピーク転送レートを達成する方法 (C++ 、Fortran (英語))
- オフロードに関連するメモリー割り当てオーバーヘッドを軽減するための手法 (C++ 、Fortran) (英語)
- オフロードポインターの関連付けと alloc/into キーワードの利用 (C++、Fortran) (英語)
添付ファイル | サイズ |
---|---|
2.1.1-new-compiler-user-basic-usage.pdf | 3.79MB |
fp-control-2013-03.pdf | 2.14MB |