インテル® VTune™ Amplifier XE によるマルチスレッド化とタスク解析
同カテゴリーの次の記事
MIC アプリケーションの SIMD ベクトル化ループでベクトル強度 0.0 がなる問題
パフォーマンス向上の可能性を求める開発者は、実行のシリアルステージと並列ステージを組み合わせたパイプラインを構成できるアプリケーションのクラスを検討することがあるでしょう。その場合スレッドの管理には注意が必要です。インテル® スレッディング・ビルディング・ブロック (インテル® TBB) を使用すると、適切なスレッド管理によって並列性が向上し、パイプラインの構築など並列アルゴリズムの設計とサポートにかかる時間や労力を軽減できます。インテル® TBB により、プログラマーは実行ステージをスレッドにマップしてスレッド間のワークバランスを取るという困難な作業をしなくて済みます。問題を実行タスクのセットとして表現するだけで、インテル® TBB は、システムで利用可能なハードウェア・スレッドへタスクを動的に割り当てます。タスク管理はアプリケーションの複雑さに応じて重要になります。インテル® VTune™ Amplifier XE のタスク解析では、問題調査向けの便利なビジュアル・インストルメントが提供されるため、プログラマーは時間をかけることなく、ユーザータスクを調整することができます。ここでは、実際の問題を単純化した例を用いて、パフォーマンス向上を実現する並列化、パイプラインの構築、タスク解析について説明します。
関連記事
新しいマイクロアーキテクチャーでアプリケーションはどのように実行されるのか? この疑問に答えるインテル® VTune™ Amplifier XE 2011 この記事は、Dr.Dobb's Go Parallel に掲載されている「How Do Applications Run on a New Micro-Architecture? Intel VTune Amplifier XE 2011 Answers the […]
インテル® VTune™ Amplifier XE Linux* 版を使用するためのコンパイラー・オプション この記事は、インテル® ソフトウェア・ネットワークに掲載されている「Compiler Switches for Intel® VTune™ Amplifier XE for Linux*」の日本語参考訳です。 はじめに: インテル® VTune™ Amplifier XE Linux* […]
レイテンシーの長い命令の影響を特定する この記事は、インテル® ソフトウェア・ネットワークに掲載されている「Identify Long Latency Instruction Impacts」の日本語参考訳です。 除算や平方根演算のようにレイテンシーの長い命令は、アプリケーション実行中にストールの原因となります。インテル® VTune™ […]
スレッドローカル変数へのアクセスに隠されたパフォーマンス・コスト この記事は、インテル® ソフトウェア・ネットワークに掲載されている「The hidden performance cost of accessing thread-local variables」の日本語参考訳です。 コードを並列化した後に期待していたパフォーマンスが得られなかったことはありませんか? […]
[Bottom-up (ボトムアップ)] ペインと [Call Stack (コールスタック)] ペインの不一致 この記事は、インテル® ソフトウェア・ネットワークに掲載されている「Mismatched Call Stacks between Bottom-up tree and Call Stack pane」の日本語参考訳です。 hotspot、コンカレンシー、ロックと待機などのスタックのサンプル収集を行う解析では、[Bottom-up […]
-
-
C++ 開発者が陥りやすい OpenMP* の 32 の罠 2011年12月22日
-
StdAfx.h に関する考察 2015年7月29日
-
セグメンテーション・フォルト SIGSEGV や SIGBUS エラーの原因を特定する 2012年2月24日
-
インテル® SSE およびインテル® AVX 世代 (SSE2、SSE3、SSSE3、ATOM_SSSE3、SSE4.1、SSE4.2、ATOM_SSE4.2、AVX、AVX2、AVX-512) 向けのインテル® コンパイラー・オプションとプロセッサー固有の最適化 2017年12月26日
-
コンパイラー最適化入門: 第1回 SIMD 命令とプロセッサーの関係 2011年5月5日
-
プログラミング、リファクタリング、そしてすべてにおける究極の疑問 2018年5月15日
-
ゲーム AI の設計 (その 1) – 設計と実装 2011年7月22日
-
インテル® コンパイラーによる AVX 最適化入門: 第1回 AVX とは 2011年8月19日
-
ウェイクロック: Android* アプリケーションでスリープしない問題の検出 2013年9月5日
-
64 コアを超える Windows 環境でマルチスレッド・プログラミングをしてみる 2011年11月23日
-