<?xml version="1.0" encoding="utf-8" ?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:syn="http://purl.org/rss/1.0/modules/syndication/" xmlns="http://purl.org/rss/1.0/">




    



<channel rdf:about="http://www.cms-initiative.jp/ja/education/websession/RSS">
  <title>Web講習会</title>
  <link>http://www.cms-initiative.jp</link>

  <description>
    
      
    
  </description>

  

  
            <syn:updatePeriod>daily</syn:updatePeriod>
            <syn:updateFrequency>1</syn:updateFrequency>
            <syn:updateBase>2013-10-07T14:14:37Z</syn:updateBase>
        

  <image rdf:resource="http://www.cms-initiative.jp/logo.png"/>

  <items>
    <rdf:Seq>
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/copy_of_intel"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/mpi"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/openmp"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/hybrid"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/2014-haishinB-14"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-01"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-02"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-03"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-04"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-05"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/optimization"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/optimization2"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/8ot91v"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-implement/blaslapack1"/>
      
      
        <rdf:li rdf:resource="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-implement/blaslapack2"/>
      
    </rdf:Seq>
  </items>

</channel>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/copy_of_intel">
    <title>インテル Xeon Phi コプロセッサー向け最適化、並列化概要</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/copy_of_intel</link>
    <description>2014年前期に行われたCMSI計算科学技術特論Bの講義「第15回 インテル Xeon Phi コプロセッサー向け最適化、並列化概要」の紹介をしています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37302735?rel=0" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/15th-0724ikei" target="_blank" title="CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1">CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<p> </p>
<hr />
<h2>1. インテルXeonプロセッサーとインテルXeon Phiコアプロセッサー</h2>
<ul>
<li><strong>インテルXeonプロセッサーの特徴 ( P.4,　<a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=3m42s">ビデオ画像</a>)</strong></li>
<li><strong>インテルXeon Phi製品ファミリー ( P.6,　<a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=6m09s">ビデオ画像</a>)</strong></li>
<li><strong>インテルXeon Phiコプロセッサー ( P.8,　<a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=8m53s">ビデオ画像</a>)</strong></li>
<li><strong>インテルXeon Phiコプロセッサー製品ファミリ ( P.11,　<a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=13m12s">ビデオ画像</a>)</strong></li>
</ul>
<p><strong> </strong></p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37302735?rel=0&amp;startSlide=4" width="427"></iframe></p>
<p><strong><a href="https://www.slideshare.net/cms_initiative/15th-0724ikei" target="_blank" title="CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1">CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1</a> </strong><span> from </span><strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></p>
<p><strong><br /></strong></p>
<hr />
<h2>2. Phiコプロセッサーの高並列アーキテクチャ</h2>
<ul>
<li><strong><span>インテルXeon Phiコプロセッサーによる性能向上 ( P.14, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=15m39s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>インテルXeon Phiコプロセッサー　アーキテクチャ概要 ( P.16, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=17m58s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>VPUブロック図 ( P.20, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=24m09s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>ベクトル命令の概要 ( P.22, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=25m20s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>Fused Multiply Add（乗加算） ( P.23, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=25m47s">ビデオ画像</a><span>)</span></strong></li>
<ul>
</ul>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37302735?rel=0&amp;startSlide=14" width="427"></iframe></p>
<p><strong><a href="https://www.slideshare.net/cms_initiative/15th-0724ikei" target="_blank" title="CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1">CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1</a> </strong><span> from </span><strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></p>
<p><strong><br /></strong></p>
<hr />
<h2>3. Phiコプロセッサーに適したアプリ領域とプログラミング領域</h2>
<ul>
<li><strong><span>インテルXeon Phiコプロセッサへのワークロード適合性 ( P.26, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=28m06s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>プログラミングの可能性：重要な特長 ( P.30, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=31m22s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>簡単な例 ( P.33, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=33m09s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>インテルXeon Phiコプロセッサで結果を得るには ( P.36, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=34m34s">ビデオ画像</a><span>)</span></strong></li>
<ul>
</ul>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37302735?rel=0&amp;startSlide=26" width="427"></iframe></p>
<p><strong><a href="https://www.slideshare.net/cms_initiative/15th-0724ikei" target="_blank" title="CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1">CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1</a> </strong><span> from </span><strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></p>
<p><strong><br /></strong></p>
<hr />
<h2>4. 現状の性能データ</h2>
<ul>
<li><strong><span>ベンチマーク結果（Intel MKL） ( P.45, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=34m57s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>実アプリケーション性能 ( P.47, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=35m55s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>まとめ ( P.48, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=36m36s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>Knights Landing：次世代のIntel Xeon Phi ( P.49, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=36m39s">ビデオ画像</a><span>)</span></strong></li>
<ul>
</ul>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37302735?rel=0&amp;startSlide=45" width="427"></iframe></p>
<p><strong><a href="https://www.slideshare.net/cms_initiative/15th-0724ikei" target="_blank" title="CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1">CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1</a> </strong><span> from </span><strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></p>
<p><strong><br /></strong></p>
<ul>
<div></div>
</ul>
<hr />
<ul>
</ul>
<ul>
</ul>
<ul>
</ul>
<ul>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37306120?rel=0" width="427"> </iframe>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/cmsib15-xeon-phi-2" target="_blank" title="CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 2">CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
</ul>
<p><span>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</span></p>
<p><span><br /></span></p>
<hr />
<h2>5. インテルソフトフェア開発製品の紹介</h2>
<ul>
<li><strong><span>インテルソルトウェア開発製品の活用 ( P.5, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=41m36s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>インテルComposer XE ( P.6, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=42m06s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>インテルデバッガー（IDB） ( P.7, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=42m31s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>インテルVtune Amplifir XE ( P.8, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=42m57s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>インテルMIC対応インテルMPI ( P.9, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=43m31s">ビデオ画像</a><span>)</span></strong></li>
<ul>
</ul>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37306120?rel=0&amp;startSlide=5" width="427"></iframe></p>
<p><strong><a href="https://www.slideshare.net/cms_initiative/cmsib15-xeon-phi-2" target="_blank" title="CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 2">CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 2</a> </strong><span> from </span><strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></p>
<p><strong><br /></strong></p>
<hr />
<h2>6. インテルXeon Phiコプロセッサー向けプログラミング概要</h2>
<ul>
<li><strong><span>インテルXeon Phiコプロセッサーの概要と構成例 ( P.12, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=44m53s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>実行モデルの概要 ( P.15, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=47m13s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>ソフトウェア構成概要 ( P.17, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=49m06s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>非共有型オフロード ( P.19, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=50m35s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>ネイティブ実行モデルの概要 ( P.24, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=64m35s">ビデオ画像</a><span>)</span></strong></li>
<li><strong><span>スカラー編算とSIMD演算の比較 ( P.29, </span><a class="external-link" href="https://www.youtube.com/watch?v=jXu0oG4u7Zc#t=69m11s">ビデオ画像</a><span>)</span></strong></li>
<ul>
</ul>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37306120?rel=0&amp;startSlide=12" width="427"></iframe></p>
<p><strong><a href="https://www.slideshare.net/cms_initiative/cmsib15-xeon-phi-2" target="_blank" title="CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 2">CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 2</a> </strong><span> from </span><strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></p>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの並列化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    
      <dc:subject>配信講義A</dc:subject>
    
    <dc:date>2013-04-24T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/mpi">
    <title>MPIの基礎</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/mpi</link>
    <description>2013年前期に行われたCMSI計算科学技術特論Aの講義「第2回 MPIの基礎」をもとに、MPIの基礎に関して解説しています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684391?rel=0" width="427"> </iframe></p>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<p> </p>
<hr />
<h2>1. 並列プログラミングの基礎</h2>
<ul>
<li> <strong>並列プログラミングとは何か？ ( P.4, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=01m08s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列と並行 ( P.5, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=3m46s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>並列計算機の分類 ( P.6, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=5m06s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>並列計算機のメモリ型による分類 ( P.7, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=6m35s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>並列プログラミングのモデル ( P.9, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=11m14s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>並列プログラムの種類 ( P.11, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=13m52s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>並列処理の実行形態(1) ( P.12, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=16m58s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>並列処理の実行形態(2) ( P.13, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=18m22s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> MPIの特徴( P.14, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=19m52s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> MPIの経緯( P.15, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=22m31s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li> <strong>MPIの実装( P.18, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=25m28s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> MPIによる通信( P.19, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=26m45s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> MPI関数( P.20, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=28m18s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> コミュニケータ( P.21, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=30m33s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684391?rel=0&amp;startSlide=3" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>2. 性能評価指標</h2>
<ul>
<li> <strong>性能評価指標 - 台数効果 ( P.23, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=33m06s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> アムダールの法則 ( P.24, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=36m33s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> アムダールの法則の直観例 ( P.25, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=38m14s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 基本演算 ( P.26, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=39m28s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 1次元分散 ( P.27, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=41m15s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 2次元分散 ( P.28, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=43m45s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ベクトルどうしの演算 ( P.29, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=44m54s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li><strong> 行列とベクトルの積 ( P.30, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=45m51s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684391?rel=0&amp;startSlide=22" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>3. 基本的なMPI関数</h2>
<ul>
<li> <strong>略語とMPI用語 ( P.34, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=49m29s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ランクの説明図 ( P.35, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=50m50s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> C言語のインターフェースとFortranインターフェースの違い ( P.36, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=51m20s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 基礎的なMPI関数 - MPI_Recv ( P.38, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=53m05s"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 基礎的なMPI関数 - MPI_Send ( P.40, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=55m26s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 基礎的なMPI関数 - MPI_Bcast ( P.42, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=57m34s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> リダクション演算 ( P.44, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=58m16s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 基礎的なMPI関数 -　MPI_Reduce ( P.46, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=59m24s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 基礎的なMPI関数 - MPI_Allreduce ( P.50, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=62m07s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li><strong> リダクション演算 ( P.53, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=62m33s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列の転置 ( P.54, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=63m12s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 基礎的なMPI関数 - MPI_Gather ( P.55, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=64m31s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 基礎的なMPI関数 - MPI_Scatter ( P.58, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=65m54s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684391?rel=0&amp;startSlide=33" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>4. MPIプログラム実例</h2>
<ul>
<li> <strong>MPIの起動 ( P.62, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=66m26s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列版Helloプログラムの説明 (C言語) ( P.64, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=67m36s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 変数myidの説明図 ( P.65, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=69m23s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列版Helloプログラムの説明 (Fortran言語) ( P.66, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=69m41s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> プログラム出力例 ( P.67, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=69m54s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 総和演算プログラム (逐次転送方式） ( P.68, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=70m48s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> バケツリレー方式による加算 ( P.69, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=71m20s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 1対1通信利用例 (逐次転送方式、C言語) ( P.70, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=71m37s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 1対1通信利用例 (逐次転送方式、Fortran言語) ( P.71, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=72m50s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li><strong> 総和演算プログラム (二分木通信方式) ( P.72, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=72m54s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 参考文献 ( P.76, </strong><a class="external-link" href="http://www.youtube.com/watch?v=aMGoeSH0Jos#t=76m14s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684391?rel=0&amp;startSlide=61" width="427"> </iframe></p>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの並列化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    
      <dc:subject>配信講義A</dc:subject>
    
    <dc:date>2013-04-17T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/openmp">
    <title>OpenMPの基礎</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/openmp</link>
    <description>2013年前期に行われたCMSI計算科学技術特論Aの講義「第3回 OpenMPの基礎」をもとに、OpenMPの基礎に関して解説しています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393" width="427"> </iframe></p>
<div></div>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<p> </p>
<hr />
<h2>1. OpenMP 超入門</h2>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393?startSlide=3" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>2. OpenMPの概要</h2>
<p><strong> </strong></p>
<ul>
<strong> </strong>
<li><strong> OpenMPの対象計算機 ( P.5, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=1m13s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> OpenMPとは ( P.6, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=2m08s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> OpenMPとマルチコア計算機 ( P.7, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=3m12s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> OpenMPコードの書き方の原則 ( P.9, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=7m34s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> OpenMPのコンパイルの仕方 ( P.10, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=8m07s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> OpenMPの実行可能ファイルの実行 ( P.11, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=9m49s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393?startSlide=4" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>3. OpenMPの実行モデル</h2>
<ul>
<li> <strong>OpenMPの実行モデル（C言語） ( P.13, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=11m21s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> OpenMPの実行モデル（Fortran言語） ( P.14, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=12m12s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Work sharing構文 ( P.15, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=12m42s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393?startSlide=12" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>4. 代表的な指示文</h2>
<ul>
<li> <strong>For構文（do構文） ( P.17, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=13m45s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> For構文の指定ができない例 ( P.18, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=15m03s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Sections構文 ( P.19, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=16m54"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Critical補助指示文 ( P.20, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=18m09s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Private補助指示文 ( P.21, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=19m28s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Private補助指示文の注意（Ｃ言語） ( P.22, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=20m30s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Private補助指示文の注意（Fortran言語） ( P.23, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=22m34s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> リダクション補助指示文（C言語） ( P.24, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=22m50s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> リダクション補助指示文（Fortran言語） ( P.25, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=23m46s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li><strong> リリダクション補助指示文の注意 ( P.26, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=23m55s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393?startSlide=16" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>5. その他、よく使うOpenMPの関数</h2>
<ul>
<li> <strong>最大スレッド数取得関数 ( P.28, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=26m40s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 自スレッド番号取得関数 ( P.29, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=27m02s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 時間計測関数 ( P.30, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=27m22s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393?startSlide=27" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>6. その他の構文</h2>
<ul>
<li> <strong>Single構文 ( P.32, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=27m56s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Master構文 ( P.33, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=29m21s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Flush構文 ( P.34, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=30m15s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Threadprivate構文 ( P.35, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=32m36s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393?startSlide=31" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>7. スケジューリング</h2>
<ul>
<li> <strong>スケジューリングとは ( P.37, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=34m53s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ループスケジューリングの補助指定文 ( P.39, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=37m09s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ループスケジューリングの補助指示文の使い方 ( P.42, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=40m14s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ループスケジューリングにおけるプログラミング上の注意 ( P.43, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=41m15s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Staticスケジューリングのみで負荷バランスを均衡化させる実装例 ( P.44, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=43m10s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393?startSlide=36" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>8. OpenMPのプログラミング上の注意（全般）</h2>
<ul>
<li> <strong>OpenMPによるプログラミング上の注意点 ( P.46, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=45m34s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Private補助指示文に関する注意 ( P.47, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=46m23s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Parallel構文の入れ子に関する注意 ( P.49, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=49m55s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> データ依存関係を壊しバグになる例 ( P.51, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=52m53s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Critical補助指示文による速度低下 ( P.52, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=55m14s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> OpenMPを用いた並列化の欠点 ( P.53, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=57m07s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393?startSlide=45" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>9. プログラム実例</h2>
<p><strong> </strong></p>
<ul>
<strong> </strong>
<li><strong> 行列-行列積のコードのOpenMP化の例（Ｃ言語）( P.56, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=60m23s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列-行列積のコードのOpenMP化の例（Fortran言語） ( P.57, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=60m43s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393?startSlide=55" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>10. OpenMPの高速化技法：ファーストタッチ</h2>
<ul>
<li> <strong>ファーストタッチとは ( P.59, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=61m02s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ファーストタッチの原理 ( P.60, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=62m03s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ファーストタッチの例(C言語の例) ( P.61, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=63m51s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ファーストタッチの例(Fortran言語の例) ( P.62, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=65m27s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ファーストタッチの効果の例 ( P.63, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=65m37s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 疎行列－ベクトル積でのファーストタッチの効果（AMD Quad Core Opteron, 16スレッド） ( P.64, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=68m40s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ファーストタッチの効果が大きい行列 ( P.65, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=69m48s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ファーストタッチの実装上の注意 ( P.66, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=72m14s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 参考文献 ( P.67, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q365SgPwefc#t=74m38s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684393?startSlide=58" width="427"> </iframe></p>
<div></div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの並列化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    
      <dc:subject>配信講義A</dc:subject>
    
    <dc:date>2013-04-24T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/hybrid">
    <title>Hybrid並列化技法(MPIとOpenMPの応用)</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/hybrid</link>
    <description>2013年前期に行われたCMSI計算科学技術特論Aの講義「第4回 Hybrid並列化技法(MPIとOpenMPの応用)」をもとに、Hybrid並列化技法に関して解説しています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684396?rel=0&amp;startSlide=1" width="427"> </iframe></p>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<div></div>
<p> </p>
<hr />
<h2>1. 実際の並列計算機構成例</h2>
<p><strong> </strong></p>
<ul>
<strong> </strong>
<li><strong>東京大学情報基盤センタースパコン T2Kオープンスパコン (東大版) (HA8000クラスタシステム) ( P.4, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=1m20s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>T2K (東大) での全体メモリ構成図 ( P.6, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=2m29s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>東京大学情報基盤センタースパコン FX10スーパーコンピュータシステム ( P.8, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=4m29s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>FX10の通信簿 (1TOFU単位) ( P.10, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=5m27s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>FX10の通信簿 (1TOFU単位間の結合) ( P.11, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=5m51s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684396?rel=0&amp;startSlide=3" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>2. バッチ処理とMPIジョブの投入</h2>
<ul>
<li> <strong>FX10スーパーコンピュータシステムでのジョブ実行形態の例 ( P.13, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=6m27s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> バッチ処理とは ( P.14, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=8m31s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> コンパイラの種類とインタラクティブ実行およびバッチ実行の例 (FX10) ( P.15, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=8m51s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> バッチキューの設定の仕方 (FX10の例) ( P.16, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=10m42s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> インタラクティブ実行のやり方の例 (FX10スーパーコンピュータシステム) ( P.17, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=11m39s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> pjstat --rsc の実行画面例 ( P.18, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=12m06s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> pjstat --rsc -x の実行画面例 ( P.19, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=12m50s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> pjstat --rsc -b の実行画面例 ( P.20, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=12m53s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> JOBスクリプトサンプルの説明 (ピュアMPI) (hello-pure.bash, C言語, Fortran言語共通) ( P.21, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=12m59s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列版Helloプログラムを実行しよう (ピュアMPI) ( P.23, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=16m07s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li><strong> バッチジョブ実行による標準出力、標準エラー出力 ( P.24, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=17m46s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列版Helloプログラムを実行しよう (ハイブリッドMPI) ( P.25, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=17m55s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> JOBスクリプトサンプルの説明 (ハイブリッドMPI) (hello-hy16.bash, C言語, Fortran言語共通) (hello-pure.bash, C言語, Fortran言語共通) ( P.26, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=18m34s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> その他の注意事項 (その1) ( P.28, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=20m43s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> その他の注意事項 (その2) ( P.29, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=21m45s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> MPI実行時のリダイレクトについて ( P.30, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=23m35s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684396?rel=0&amp;startSlide=12" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>3. 並列処理の評価指標 : 弱スケーリングと強スケーリング</h2>
<ul>
<li> <strong>弱スケーリング (Weak Scaling) ( P.32, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=25m23s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 強スケーリング (Strong Scaling) ( P.33, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=27m49s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 弱スケーリングと強スケーリング　適用アプリの特徴 ( P.34, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=30m06s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 強スケールアプリケーションの問題 ( P.35, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=31m06s"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684396?rel=0&amp;startSlide=31" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>4. ピュアMPIプログラム開発の基礎</h2>
<ul>
<li> <strong>MPI並列化の大前提 (再確認) ( P.37, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=32m34s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列化の考え方 ( P.38, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=32m59s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列化の考え方 (Fortran言語) ( P.39, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=34m16s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 初心者が注意すること ( P.40, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=34m22s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列プログラム開発の指針 ( P.41, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=34m59s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 数値計算プログラムの特徴を利用し並列化がなされる ( P.42, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=36m17s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列化の方針の例 (C言語) ( P.43, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=38m05s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列化の方針の例 (Fortran言語) ( P.44, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=40m49s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> データ分散方式に関する注意 ( P.45, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=41m03s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列化の方針 (行列-ベクトル積) (C言語) ( P.46, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=42m18s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li><strong> 並列化の方針 (行列-ベクトル積) (Fortran言語) ( P.47, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=42m41s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列化の方針 (行列-ベクトル積) ( P.48, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=42m44s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列化の方針のまとめ ( P.49, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=43m03s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列 - ベクトル積のピュアMPI並列化の例 (C言語) ( P.50, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=44m28s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列 - ベクトル積のピュアMPI並列化の例 (Fortran言語) ( P.51, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=45m08s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> nがMPIプロセス数で割り切れない時 ( P.52, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=45m29s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>余りが多い場合 ( P.53, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=46m00s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684396?rel=0&amp;startSlide=36" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>5. ハイブリッドMPIプログラム開発の基礎</h2>
<ul>
<li> <strong>用語の説明 ( P.55, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=47m23s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ハイブリッドMPI実行の目的 ( P.56, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=48m37s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ハイブリッドMPI並列プログラムの開発の指針 ( P.57, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=49m26s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列 - ベクトル積のハイブリッドMPI並列化の例 (C言語) ( P.58, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=50m03s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列 - ベクトル積のハイブリッドMPI並列化の例(Fortran言語) ( P.59, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=50m52s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ハイブリッドMPI実行の注意点(その1) ( P.60, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=51m00s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ハイブリッドMPI実行の注意点(その2) ( P.61, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=52m22s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ハイブリッドMPI実行の注意点(その3) ( P.62, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=53m51s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ハイブリッドMPIの起動方法 ( P.63, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=55m08s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 数値計算ライブラリとハイブリッドMPI実行 ( P.64, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=56m27s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> スレッド並列版BLAS利用の注意 ( P.65, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=57m15s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li><strong> 逐次BLASをスレッド並列化して呼び出す例 ( P.66, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=58m33s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ＜スレッド並列版BLAS＞と＜逐次BLASを上位のループでスレッド並列呼び出し＞する時の性能例 ( P.67, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=59m10s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> n=1000での性能(T2K(1ノード,16コア)) BLAS内でスレッド並列化する場合に対する速度向上 ( P.68, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=59m35s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ScaLAPACKにおけるハイブリッドMPI実行の効果の例 ( P.69, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=60m17s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> コンパイラの最適化の影響 (その1) ( P.71, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=62m43s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> コンパイラの最適化の影響 (その2) ( P.72, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=63m59s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ハイブリッドMPIプログラミングのまとめ ( P.73, </strong><a class="external-link" href="http://www.youtube.com/watch?v=-5TSQ7SI7oU#t=65m45s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684396?rel=0&amp;startSlide=54" width="427"> </iframe></p>
<div></div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの並列化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    
      <dc:subject>配信講義A</dc:subject>
    
    <dc:date>2013-05-08T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/2014-haishinB-14">
    <title>OpenACC・CUDAによるGPUコンピューティング</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-parallel/2014-haishinB-14</link>
    <description>2014年前期に行われたCMSI計算科学技術特論Bの講義「第14回　OpenACC・CUDAによるGPUコンピューティング」の紹介をしています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37067747?rel=0" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/14th-0717naruse" target="_blank" title="CMSI計算科学技術特論B(14) OpenACC・CUDAによるGPUコンピューティング">CMSI計算科学技術特論B<span class="GINGER_SOFTWARE_mark" id="c941b1bd-1002-4d9c-804f-dd2ff9cdf0d0"><span class="GINGER_SOFTWARE_mark" id="747a5c26-18f9-49f7-80b3-a6eea979a7df">(</span></span>14) OpenACC・CUDAによるGPUコンピューティング</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<div></div>
<p> </p>
<hr />
<h2>1. GPUコンピューティング、CUDAの概要</h2>
<ul>
<li><strong>GPUコンピューティング ( P.3,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=0m53s">ビデオ画像</a>)</strong></li>
<li><strong>GPUの構造 ( P.8,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=4m00s">ビデオ画像</a>)</strong></li>
<li><strong>CUDAプログラミングモデル ( P.11,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=11m17s">ビデオ画像</a>)<br /></strong></li>
<li><strong>SAXPY（Y＝A*X+Y) <span class="GINGER_SOFTWARE_mark" id="876473c8-df57-4e56-9283-e2cb0c516134"><span class="GINGER_SOFTWARE_mark" id="a4749108-229a-4018-83b3-5afaddc697c6">( </span></span>P.16,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=13m23s">ビデオ画像</a>) </strong></li>
<strong><strong> </strong></strong> 
</ul>
<p> </p>
<div id="_mcePaste">
<ul>
</ul>
</div>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37067747?rel=0&amp;startSlide=3" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/14th-0717naruse" target="_blank" title="CMSI計算科学技術特論B(14) OpenACC・CUDAによるGPUコンピューティング">CMSI計算科学技術特論B<span class="GINGER_SOFTWARE_mark" id="14772869-0369-477d-a961-31d32ef34961"><span class="GINGER_SOFTWARE_mark" id="42edd9e2-9e32-4f05-9a9a-28b8d0a33438">(</span></span>14) OpenACC・CUDAによるGPUコンピューティング</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>2. <span class="GINGER_SOFTWARE_mark" id="eb369588-1afd-4aaa-8073-80826e50bbbd"><span class="GINGER_SOFTWARE_mark" id="456fc58d-a897-4e47-b7a7-98e137343902">OpenACC</span></span></h2>
<ul>
<li><strong>実行モデル ( P.21,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=22m06s">ビデオ画像</a>)<br /></strong></li>
<li><strong>SAXPY（Y＝A*X+Y) <span class="GINGER_SOFTWARE_mark" id="3b2ace26-a002-43b5-843d-807b5c18523a"><span class="GINGER_SOFTWARE_mark" id="7bfbf18c-7b52-48d3-a45f-ba11a0600022">( </span></span>P.22,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=22m49s">ビデオ画像</a>)<br /></strong></li>
<li><strong>OpenMPとの併用 ( P.25,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=26m05s">ビデオ画像</a>)</strong></li>
<li><strong>例：Jacobi iteration ( P.32,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=29m28s">ビデオ画像</a>)</strong></li>
<li><strong>データ転送 ( P.37,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=35m30s">ビデオ画像</a>)</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37067747?rel=0&amp;startSlide=20" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/14th-0717naruse" target="_blank" title="CMSI計算科学技術特論B(14) OpenACC・CUDAによるGPUコンピューティング">CMSI計算科学技術特論B<span class="GINGER_SOFTWARE_mark" id="e50d1c5b-cda8-4bac-a83f-c31285e3cf12"><span class="GINGER_SOFTWARE_mark" id="e4eb0025-5871-4112-8122-d476929cb4da">(</span></span>14) OpenACC・CUDAによるGPUコンピューティング</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<div></div>
<p> </p>
<div></div>
<ul>
</ul>
<div></div>
<hr />
<h2>3. カーネルチューニング</h2>
<ul>
<li><strong>カーネルチューニング（Loop construct) ( P.47,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=44m34s">ビデオ画像</a>)<br /></strong></li>
<li><strong>実行条件設定(Vector clause) ( P.50,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=46m14s">ビデオ画像</a>)<br /></strong></li>
<li><strong>カーネルチューニング（Loop construct) ( P.51,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=48m06s">ビデオ画像</a>) </strong></li>
</ul>
<ul>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37067747?rel=0&amp;startSlide=47" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/14th-0717naruse" target="_blank" title="CMSI計算科学技術特論B(14) OpenACC・CUDAによるGPUコンピューティング">CMSI計算科学技術特論B<span class="GINGER_SOFTWARE_mark" id="1125fb7a-3934-4225-9ed2-619e637f8681"><span class="GINGER_SOFTWARE_mark" id="4fc3d900-8ae7-4c5a-b34f-e1f41d3e833c">(</span></span>14) OpenACC・CUDAによるGPUコンピューティング</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>4. MPIとは簡単に併用できるの？</h2>
<ul>
<li><strong>MPI並列（Halo exchange) ( P.55,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=54m30s">ビデオ画像</a>)<br /></strong></li>
<li><strong>MPI Jacoi iteration <span class="GINGER_SOFTWARE_mark" id="fca049c9-2d53-470d-aa88-cb8a8116850d"><span class="GINGER_SOFTWARE_mark" id="96e31fae-8553-4bcb-a141-169de3518c16">( </span></span>P.56,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=55m39s">ビデオ画像</a>)<br /></strong></li>
<li><strong>オーバーラップ（Async/Wait clause) ( P.60,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=59m42s">ビデオ画像</a>)</strong></li>
<li><strong>まとめ（P.67,　<a class="external-link" href="https://www.youtube.com/watch?v=ozWfaHPPL98#t=70m16s">ビデオ画像</a>）</strong></li>
</ul>
<p> </p>
<div><strong> </strong></div>
<div><strong> 
<ul>
</ul>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/37067747?rel=0&amp;startSlide=55" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/14th-0717naruse" target="_blank" title="CMSI計算科学技術特論B(14) OpenACC・CUDAによるGPUコンピューティング">CMSI計算科学技術特論B<span class="GINGER_SOFTWARE_mark" id="47cee51b-4126-452c-9dad-58c13f52522f"><span class="GINGER_SOFTWARE_mark" id="cc688b66-5d4c-4ac9-980e-4f4d6f06759b">(</span></span>14) OpenACC・CUDAによるGPUコンピューティング</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<div></div>
<p> </p>
<div></div>
<ul>
</ul>
<div></div>
</strong></div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの並列化</dc:subject>
    
    
      <dc:subject>配信講義B</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    <dc:date>2014-06-11T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-01">
    <title>スーパーコンピュータとアプリケーションの性能</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-01</link>
    <description>2014年前期に行われたCMSI計算科学技術特論Bの講義「第1回　スーパーコンピュータとアプリケーションの性能」の紹介をしています。　</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33309161?rel=0" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能" target="_blank" href="https://www.slideshare.net/cms_initiative/cmsib1">CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<div><b>
<div></div>
<p> </p>
<hr />
<h2>1. スーパーコンピュータとは？</h2>
<ul>
<li>スーパーコンピュータとは… ( P.5,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=4m30s" class="external-link">ビデオ画像</a>)</li>
<li>スーパーコンピュータの発展 ( P.6,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=5m33s" class="external-link">ビデオ画像</a>)</li>
<li><b>コンピュータとは？ ( P.7,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=9m46s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>昔のスーパーコンピュータ ( P.8,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=11m27s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>シングルプロセッサの問題 ( P.9,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=13m31s" class="external-link">ビデオ画像</a>)</b></li>
<li>ベクトル機 ( P.12,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=19m22s" class="external-link">ビデオ画像</a>)</li>
<li><b>シングルプロセッサの問題 ( P.13,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=20m43s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>スカラー機 ( P.14,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=22m32s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>シングルプロセッサの問題 ( P.15,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=23m18s" class="external-link">ビデオ画像</a>)</b></li>
<li><b><b>最近のスーパーコンピュータ ( P.16,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=24m13s" class="external-link">ビデオ画像</a>)</b></b></li>
<li><b><b>インターコネクトの種類 ( P.17,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=25m55s" class="external-link">ビデオ画像</a>)</b></b></li>
<li><b><b>コンピュータ(ノード)どうしをつなぐ ( P.21,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=36m03s" class="external-link">ビデオ画像</a>)</b></b></li>
<li><b><b>ちなみに「京」の場合は？ ( P.24,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=37m52s" class="external-link">ビデオ画像</a>)</b></b></li>
<li><b><b>まとめ ( P.26,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=39m25s" class="external-link">ビデオ画像</a>)</b></b></li>
</ul>
<span><b><br /></b></span> 
<ul>
</ul>
<div id="_mcePaste"></div>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33309161?rel=0&amp;startSlide=5" width="427"> </iframe>
<div><b> <a title="CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能" target="_blank" href="https://www.slideshare.net/cms_initiative/cmsib1">CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<div></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>2. アプリケーションの性能とは？</h2>
<ul>
<li><b>スパコンはシミュレーションに使う ( P.28,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=40m53s" class="external-link">ビデオ画像</a>)</b></li>
<li>具体的なアプリケーション ( P.29,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=41m13s" class="external-link">ビデオ画像</a>)</li>
<li>現代のスパコンの利用の難しさ ( P.30,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=42m55s" class="external-link">ビデオ画像</a>)</li>
<li>計算科学と計算機科学について ( P.31,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=44m08s" class="external-link">ビデオ画像</a>)</li>
<li>並列処理と依存性の回避 ( P.32,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=46m47s" class="external-link">ビデオ画像</a>)</li>
<li>まとめ ( P.43,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=64m55s" class="external-link">ビデオ画像</a>)</li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33309161?rel=0&amp;startSlide=28" width="427"> </iframe>
<div><b> <a title="CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能" target="_blank" href="https://www.slideshare.net/cms_initiative/cmsib1">CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<div></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>3. 高並列化のための重要点</h2>
<ul>
<li><b>そもそも並列化とは？ ( P.46,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=67m17s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>必要な並列度を確保するとは？ ( P.49,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=70m22s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>非並列部が問題になる場合 ( P.50,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=71m53s" class="external-link">ビデオ画像</a>)</b></li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33309161?rel=0&amp;startSlide=46" width="427"> </iframe>
<div><b> <a title="CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能" target="_blank" href="https://www.slideshare.net/cms_initiative/cmsib1">CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>4. 単体性能向上のための重要点</h2>
<ul>
<li><b>プロセッサの単体性能を引き出す ( P.52,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=74m27s" class="external-link">ビデオ画像</a>)</b></li>
<li><b><b>まとめ ( P.57,　<a href="http://www.youtube.com/watch?v=GTHT9W8An-E#t=78m06s" class="external-link">ビデオ画像</a>)</b></b></li>
</ul>
<ul>
</ul>
</b></div>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33309161?rel=0&amp;startSlide=52" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能" target="_blank" href="https://www.slideshare.net/cms_initiative/cmsib1">CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<ul>
</ul>
<div></div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>配信講義B</dc:subject>
    
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの最適化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    <dc:date>2014-04-09T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-02">
    <title>アプリケーションの性能最適化1(高並列性能性能最適化)</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-02</link>
    <description>2014年前期に行われたCMSI計算科学技術特論Bの講義「第2回　アプリケーションの性能最適化1(高並列性能性能最適化)」の紹介をしています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33596817?rel=0" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論B(2) アプリケーションの性能最適化1" target="_blank" href="https://www.slideshare.net/cms_initiative/0417minami">CMSI計算科学技術特論B(2) アプリケーションの性能最適化1</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<p> </p>
<hr />
<h2>1. 反復法</h2>
<div id="_mcePaste">
<ul>
<li><span><b>差分法と連立一次方程式 ( P.5,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=2m34s" class="external-link">ビデオ画像</a>)</b></span></li>
<li><span><b>反復法の一般的な議論 ( P.6,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=4m53s" class="external-link">ビデオ画像</a>)</b></span></li>
<li><span><b>各反復法 ( P.7,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=6m35s" class="external-link">ビデオ画像</a>)</b></span></li>
<li><span><b>共役勾配法(CG法) ( P.10,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=15m45s" class="external-link">ビデオ画像</a>)</b></span></li>
<li><span><b>前処理付き共役勾配法(CG法) ( P.12,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=18m53s" class="external-link">ビデオ画像</a>)</b></span></li>
</ul>
</div>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33596817?rel=0&amp;startSlide=5" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論B(2) アプリケーションの性能最適化1" target="_blank" href="https://www.slideshare.net/cms_initiative/0417minami">CMSI計算科学技術特論B(2) アプリケーションの性能最適化1</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>2. アプリケーションの性能最適化</h2>
<ul>
<li><b>計算科学・計算機科学について ( P.15,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=23m07s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>アプリケーションの性能最適化のステップ ( P.17,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=24m02s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>並列特性分析・カーネル評価 ( P.18,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=24m39s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>並列特性分析・高並列化 ( P.21,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=27m56s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>アプリケーションの高並列性を評価するためには？ ( P.22,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=28m13s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>単体性能向上策決定 ( P.30,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=38m15s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>高性能化策実装・実機でのチューニング ( P.33,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=42m51s" class="external-link">ビデオ画像</a>)</b></li>
</ul>
<p> </p>
<div><b> <iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33596817?rel=0&amp;startSlide=15" width="427"> </iframe>
<div><b> <a title="CMSI計算科学技術特論B(2) アプリケーションの性能最適化1" target="_blank" href="https://www.slideshare.net/cms_initiative/0417minami">CMSI計算科学技術特論B(2) アプリケーションの性能最適化1</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>3. 簡単な実例</h2>
<ul>
<li><b>K-scope ( P.35,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=44m15s" class="external-link">ビデオ画像</a>)</b></li>
<li>NPB MGを使用した解析例 ( P.36,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=45m41s" class="external-link">ビデオ画像</a>)</li>
<b>
<li>アプリケーションの構造の調査(概要・確認) ( P.38,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=48m34s" class="external-link">ビデオ画像</a>)</li>
<li>データ分割の調査 ( P.42,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=54m16s" class="external-link">ビデオ画像</a>)</li>
<li><b>スケーラビリティの調査 ( P.44,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=56m12s" class="external-link">ビデオ画像</a>)</b></li>
</b> 
</ul>
</b></div>
<p> </p>
<div><b> 
<ul>
<b> </b> 
</ul>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33596817?rel=0&amp;startSlide=35" width="427"> </iframe>
<div><b> <a title="CMSI計算科学技術特論B(2) アプリケーションの性能最適化1" target="_blank" href="https://www.slideshare.net/cms_initiative/0417minami">CMSI計算科学技術特論B(2) アプリケーションの性能最適化1</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>4. 並列性能上のボトルネック</h2>
<ul>
<li><b>並列性能上のボトルネック ( P.51,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=63m29s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>アプリケーションとハードウェアのミスマッチ ( P.52,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=64m32s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>非並列部の残存 ( P.53,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=66m25s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>大域通信における大きな通信サイズ・通信回数 ( P.55,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=68m11s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>フルノードにおける大域通信の発生 ( P.56,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=70m46s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>隣接通信における大きな通信サイズ・通信回数 ( P.57,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=72m43s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>ロードインバランスの発生 ( P.58,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=73m44s" class="external-link">ビデオ画像</a>)</b></li>
<li><b>まとめ ( P.59,　<a href="http://www.youtube.com/watch?v=T480C0nSZNI#t=75m15s" class="external-link">ビデオ画像</a>)</b></li>
</ul>
</b></div>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33596817?rel=0&amp;startSlide=51" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論B(2) アプリケーションの性能最適化1" target="_blank" href="https://www.slideshare.net/cms_initiative/0417minami">CMSI計算科学技術特論B(2) アプリケーションの性能最適化1</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>配信講義B</dc:subject>
    
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの最適化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    <dc:date>2014-04-16T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-03">
    <title>アプリケーションの性能最適化2(CPU単体性能最適化)</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-03</link>
    <description>2014年前期に行われたCMSI計算科学技術特論Bの講義「第3回　アプリケーションの性能最適化2(CPU単体性能最適化)」の紹介をしています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33842350?rel=0" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/cmsib2-1" target="_blank" title="CMSI計算科学技術特論B(3) アプリケーションの性能最適化2">CMSI計算科学技術特論B(3) アプリケーションの性能最適化2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<div></div>
<p> </p>
<hr />
<h2>1. スレッド並列化</h2>
<div id="_mcePaste">
<ul>
<li><strong>スレッド並列の概要</strong><strong> ( P.5,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=2m52s">ビデオ画像</a>)</strong></li>
<li><span><strong>ハイブリッド並列とフラットMPI並列</strong></span><strong>( P.6,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=5m03s">ビデオ画像</a>)</strong></li>
</ul>
</div>
<p> </p>
<div id="_mcePaste">
<ul>
</ul>
</div>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33842350?rel=0&amp;startSlide=5" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/cmsib2-1" target="_blank" title="CMSI計算科学技術特論B(3) アプリケーションの性能最適化2">CMSI計算科学技術特論B(3) アプリケーションの性能最適化2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>2. CPU単体性能を上げるための5つの要素</h2>
<ul>
<li><strong>CPU単体性能を上げるための5つの要素 ( P.9,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=9m51s">ビデオ画像</a>)</strong></li>
<li><strong>(1)ロード・ストアの効率化 ( P.10,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=12m32s">ビデオ画像</a>)</strong></li>
<li><strong>(2)ラインアクセスの有効利用 ( P.15,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=16m33s">ビデオ画像</a>)</strong></li>
<li><strong>(3)キャッシュの有効利用 ( P.16,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=17m53s">ビデオ画像</a>)</strong></li>
<li><strong>(4)効率の良い命令スケジューリング ( P.17,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=18m42s">ビデオ画像</a>)</strong></li>
<li><strong>並列処理と依存性の回避 ( P.18,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=19m38s">ビデオ画像</a>)</strong></li>
<li><strong>(5)演算器の有効利用 ( P.22,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=24m10s">ビデオ画像</a>)</strong></li>
</ul>
<p> </p>
<div><strong><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33842350?rel=0&amp;startSlide=9" width="427"> </iframe>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/cmsib2-1" target="_blank" title="CMSI計算科学技術特論B(3) アプリケーションの性能最適化2">CMSI計算科学技術特論B(3) アプリケーションの性能最適化2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>3. 要求B/F値と5つの要素の関係</h2>
<ul>
<li><strong>要求B/F値と5つの要素の関係 ( P.24,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=26m24s">ビデオ画像</a>)</strong></li>
</ul>
<ul>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33842350?rel=0&amp;startSlide=24" width="427"> </iframe>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/cmsib2-1" target="_blank" title="CMSI計算科学技術特論B(3) アプリケーションの性能最適化2">CMSI計算科学技術特論B(3) アプリケーションの性能最適化2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>4. 性能予測手法(要求B/F値が大きい場合)</h2>
<ul>
<li><strong>CPU単体性能チューニング手順 ( P.29,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=34m50s">ビデオ画像</a>)</strong></li>
<li><strong>ルーフラインモデル ( P.30,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=37m30s">ビデオ画像</a>)</strong></li>
<li><strong>ベースとなる性能値 ( P.31,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=39m15s">ビデオ画像</a>)</strong></li>
<li><strong>メモリとキャッシュアクセス ( P.32,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=40m58s">ビデオ画像</a>)</strong></li>
<li><strong>性能見積り ( P.34,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=45m06s">ビデオ画像</a>)</strong></li>
</ul>
</strong></div>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33842350?rel=0&amp;startSlide=29" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/cmsib2-1" target="_blank" title="CMSI計算科学技術特論B(3) アプリケーションの性能最適化2">CMSI計算科学技術特論B(3) アプリケーションの性能最適化2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>5. 具体的なテクニック</h2>
<ul>
<li><strong>スレッド並列化 ( P.36,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=47m39s">ビデオ画像</a>)</strong></li>
<li><strong>CG法前処理のスレッド並列化 ( P.37,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=48m58s">ビデオ画像</a>)</strong></li>
<li><strong>ロード・ストアの効率化 ( P.39,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=52m27s">ビデオ画像</a>)</strong></li>
<li><strong>ラインアクセスの有効利用 ( P.44,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=61m04s">ビデオ画像</a>)</strong></li>
<li><strong>キャッシュの有効利用 ( P.46,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=63m35s">ビデオ画像</a>)</strong></li>
<li><strong>効率の良いスケジューリング・演算器の有効利用 ( P.54,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=74m23s">ビデオ画像</a>)</strong></li>
<li><strong>まとめ ( P.60,　<a class="external-link" href="https://www.youtube.com/watch?v=hPYNpxPDguU#t=81m07s">ビデオ画像</a>)</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/33842350?rel=0&amp;startSlide=36" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/cmsib2-1" target="_blank" title="CMSI計算科学技術特論B(3) アプリケーションの性能最適化2">CMSI計算科学技術特論B(3) アプリケーションの性能最適化2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>配信講義B</dc:subject>
    
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの最適化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    <dc:date>2014-04-23T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-04">
    <title>アプリケーションの性能最適化の実例1</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-04</link>
    <description>2014年前期に行われたCMSI計算科学技術特論Bの講義「第4回　アプリケーションの性能最適化の実例1」の紹介をしています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34363376?rel=0" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0508minami" target="_blank" title="CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1">CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<div></div>
<p> </p>
<hr />
<h2>1. 理研で進めた性能最適化</h2>
<p> </p>
<div id="_mcePaste">
<ul>
</ul>
</div>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34363376?rel=0&amp;startSlide=5" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0508minami" target="_blank" title="CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1">CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>2. RSDFTの性能最適化</h2>
<ul>
<li><strong>RSDFTとは ( P.9,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=8m53s">ビデオ画像</a>)</strong></li>
<li><strong>原理 ( P.10,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=10m29s">ビデオ画像</a>)</strong></li>
<li><strong>計算フロー ( P.12,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=12m15s">ビデオ画像</a>)</strong></li>
<li><strong>並列化 ( P.14,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=14m39s">ビデオ画像</a>)</strong></li>
<li><strong>CPU単体性能の向上 ( P.15,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=15m33s">ビデオ画像</a>)</strong></li>
<li><strong>並列特性分析について ( P.19,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=22m40s">ビデオ画像</a>)</strong></li>
<li><strong>高並列化について ( P.25,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=32m47s">ビデオ画像</a>)</strong></li>
</ul>
<p> </p>
<div><strong><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34363376?rel=0&amp;startSlide=9" width="427"> </iframe>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0508minami" target="_blank" title="CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1">CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>3. PHASEの性能最適化</h2>
<ul>
<li><strong>PHASEとは ( P.40,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=51m32s">ビデオ画像</a>)</strong></li>
<li><strong>原理 ( P.41,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=52m22s">ビデオ画像</a>)</strong></li>
<li><strong>計算フロー ( P.42,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=53m40s">ビデオ画像</a>)</strong></li>
<li><strong>並列化 ( P.43,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=54m32s">ビデオ画像</a>)</strong></li>
<li><strong>並列特性分析について ( P.44,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=55m59s">ビデオ画像</a>)</strong></li>
<li><strong>高並列化・高性能化の結果 ( P.48,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=61m08s">ビデオ画像</a>)</strong></li>
<li><strong>高並列化・高性能化 ( P.49,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=61m47s">ビデオ画像</a>)</strong></li>
<li><strong>高並列化・高性能化の結果 ( P.55,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=68m59s">ビデオ画像</a>)</strong></li>
<li><strong>まとめ ( P.60,　<a class="external-link" href="https://www.youtube.com/watch?v=Fz6GvpOrkUY#t=75m37s">ビデオ画像</a>)</strong></li>
</ul>
<ul>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34363376?rel=0&amp;startSlide=40" width="427"> </iframe>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0508minami" target="_blank" title="CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1">CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
</strong></div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>配信講義B</dc:subject>
    
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの最適化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    <dc:date>2014-05-07T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-05">
    <title>アプリケーションの性能最適化の実例2</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/2014-haishinB-05</link>
    <description>2014年前期に行われたCMSI計算科学技術特論Bの講義「第5回　アプリケーションの性能最適化の実例2」の紹介をしています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34670884?rel=0" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0515minami" target="_blank" title="CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2">CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<div></div>
<p> </p>
<hr />
<h2>1. 理研で進めた性能最適化</h2>
<p> </p>
<div id="_mcePaste">
<ul>
</ul>
</div>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34670884?rel=0&amp;startSlide=5" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0515minami" target="_blank" title="CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2">CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>2. Seism3Dの性能最適化</h2>
<ul>
<li><strong>Seism3Dとは？ ( P.9,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=4m18s">ビデオ画像</a>)</strong></li>
<li><strong>並列化 ( P.10,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=6m06s">ビデオ画像</a>)</strong></li>
<li><strong>並列特性分析 ( P.11,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=7m12s">ビデオ画像</a>)</strong></li>
</ul>
<p> </p>
<div><strong> <iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34670884?rel=0&amp;startSlide=9" width="427"> </iframe>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0515minami" target="_blank" title="CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2">CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>3. Seism3Dの単体性能最適化(性能見積りとチューニング)</h2>
<ul>
<li><strong>単体性能最適化 ( P.15,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=14m43s">ビデオ画像</a>)</strong></li>
<li><strong>空間微分の計算 ( P.16,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=16m24s">ビデオ画像</a>)</strong></li>
<li><strong>XFILL指示行によるチューニング ( P.22,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=31m41s">ビデオ画像</a>)</strong></li>
<li><strong>キャッシュスラッシングの解消 ( P.23,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=33m24s">ビデオ画像</a>)</strong></li>
<li><strong>速度時間積分の計算 ( P.24,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=37m58s">ビデオ画像</a>)</strong></li>
<li><strong>CPU単体性能チューニングの結果 ( P.25,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=38m37s">ビデオ画像</a>)</strong></li>
<li><strong>Seism3Dの総合性能 ( P.26,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=39m22s">ビデオ画像</a>)</strong></li>
</ul>
<ul>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34670884?rel=0&amp;startSlide=15" width="427"> </iframe>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0515minami" target="_blank" title="CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2">CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>4. FrontFlow/blueの性能最適化</h2>
<ul>
<li><strong>FrontFlow/blue(FFb) ( P.28,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=41m08s">ビデオ画像</a>)</strong></li>
<li><strong>タイムステップループ構造 ( P.29,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=42m24s">ビデオ画像</a>)</strong></li>
<li><strong>主要部の構造 ( P.30,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=42m53s">ビデオ画像</a>)</strong></li>
<li><strong>主要計算 ( P.32,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=46m14s">ビデオ画像</a>)</strong></li>
<li><strong>並列化 ( P.33,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=47m20s">ビデオ画像</a>)</strong></li>
<li><strong>並列特性分析 ( P.34,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=48m03s">ビデオ画像</a>)</strong></li>
</ul>
</strong></div>
<p> </p>
<div><strong> 
<ul>
</ul>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34670884?rel=0&amp;startSlide=28" width="427"> </iframe>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0515minami" target="_blank" title="CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2">CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
</ul>
<hr />
<h2>5. FFbの単体性能最適化(性能見積りとチューニング)</h2>
<ul>
<li><strong>節点圧力カーネル(calaxc相当)の性能見積り ( P.39,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=54m04s">ビデオ画像</a>)</strong></li>
<li><strong>節点圧力カーネル(calaxc相当)の実測性能 ( P.40,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=57m47s">ビデオ画像</a>)</strong></li>
<li><strong>チューニング1：フルアンロール ( P.41,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=59m35s">ビデオ画像</a>)</strong></li>
<li><strong>チューニング2：リオーダリング ( P.42,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=60m23s">ビデオ画像</a>)</strong></li>
<li><strong>節点圧力カーネル(calaxc相当)チューニング結果 ( P.46,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=63m39s">ビデオ画像</a>)</strong></li>
<li><strong>節点圧力カーネル(callap)のチューニング ( P.47,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=64m19s">ビデオ画像</a>)</strong></li>
<li><strong>節点圧力カーネル(callap)の性能見積り ( P.49,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=65m34s">ビデオ画像</a>)</strong></li>
<li><strong>節点圧力カーネル(callap)の性能 ( P.50,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=66m14s">ビデオ画像</a>)</strong></li>
<li><strong>FFbのウィークスケール性能(Ver5) ( P.51,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=68m05s">ビデオ画像</a>)</strong></li>
<li><strong>FFbの総合性能(Ver7) ( P.52,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=68m20s">ビデオ画像</a>)</strong></li>
</ul>
</strong></div>
<p> </p>
<div><strong> 
<ul>
</ul>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34670884?rel=0&amp;startSlide=39" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0515minami" target="_blank" title="CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2">CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
<p> </p>
<ul>
<hr />
</ul>
<h2><span>6. NPB MGのチューニング事例</span></h2>
<ul>
<li>プロファイラーによるコスト分析 ( P.54,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=69m08s">ビデオ画像</a>)</li>
<li>ループのB/Fから推定性能を算出する ( P.55,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=69m46s">ビデオ画像</a>)</li>
<li>ループrprj3の分析 ( P.56,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=70m08s">ビデオ画像</a>)</li>
<li>ループrprj3の分析結果 ( P.58,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=71m04s">ビデオ画像</a>)</li>
<li>ループrprj3のチューニング ( P.59,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=71m27s">ビデオ画像</a>)</li>
<li>まとめ ( P.62,　<a class="external-link" href="https://www.youtube.com/watch?v=FiNuNNqGMsA#t=72m43s">ビデオ画像</a>)</li>
<ul>
</ul>
</ul>
<p><span><strong><br /></strong></span></p>
<ul>
<ul>
</ul>
</ul>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/34670884?rel=0&amp;startSlide=54" width="427"> </iframe></p>
<div><strong> <a href="https://www.slideshare.net/cms_initiative/0515minami" target="_blank" title="CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2">CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2</a> </strong> from <strong><a href="http://www.slideshare.net/cms_initiative" target="_blank">Computational Materials Science Initiative</a></strong></div>
</strong></div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>配信講義B</dc:subject>
    
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの最適化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    <dc:date>2014-05-14T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/optimization">
    <title>最適化/高速化対応</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/optimization</link>
    <description>2013年前期に行われたCMSI計算科学技術特論Aの講義「第1回 プログラム高速化の基礎」をもとに、プログラムの最適化/高速化対応に関して解説しています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684388?startSlide=1" width="427"> </iframe></p>
<div></div>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<p> </p>
<hr />
<h2>1. はじめに</h2>
<ul>
<li><strong>スーパコンピュータとは ( P.8, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=4m39s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>スーパーコンピュータで用いる単位 ( P.9, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=6m50s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>スーパコンピュータ用語 ( P.10, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=10m32s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>ムーアの法則 ( P.11, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=11m34s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>スーパーコンピュータ性能推移 (主に日本製、理論性能) ( P.12, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=12m41s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>スーパコンピュータのランキング ( P.13, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=13m06s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>現在のランキング ( P.14, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=14m14s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684388?startSlide=7" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>2. 単体（CPU）最適化の方法</h2>
<ul>
<li><strong>最近の計算機のメモリ階層構造 ( P.16, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=16m06s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>より直観的には… ( P.17, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=17m40s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>東京大学FX10のメモリ構成例 ( P.18, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=18m41s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>東京大学FX10のノードのメモリ構成例 ( P.20, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=19m28s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>東京大学FX10全体メモリ構成 ( P.21, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=20m11s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>FX10計算ノードの構成 ( P.22, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=20m30s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>東京大学FX10のCPU(SPARC64IXfx)の詳細情報 ( P.23, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=21m57s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684388?startSlide=15" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>3. 演算パイプライン</h2>
<ul>
<li><strong>流れ作業 ( P.25, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=22m44s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>計算機におけるパイプライン処理の形態 ( P.28, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=25m10s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>演算器の場合 ( P.29, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=26m28s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>演算パイプラインのまとめ ( P.31, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=28m49s"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong>実際のプロセッサの場合 ( P.32, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=29m31s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>FX10のハードウェア情報 ( P.33, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=31m26s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684388?startSlide=24" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>4. ループ内連続アクセス</h2>
<p><strong> </strong></p>
<ul>
<strong> </strong>
<li><strong>単体最適化のポイント ( P.35, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=33m16s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>言語に依存した配列の格納方式の違い ( P.36, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=34m39s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>行列積コード例(Ｃ言語) ( P.37, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=35m04s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>行列の積 ( P.38, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=35m24s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684388?startSlide=34" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>5. ループアンローリング</h2>
<p><strong> </strong></p>
<ul>
<strong> </strong>
<li><strong>ループアンローリング ( P.49, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=41m30s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>ループアンローリングの例(行列-行列積、Ｃ言語) ( P.50, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=42m04s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>ループアンローリングの例(行列-行列積、Fortran言語) ( P.55, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=45m55s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684388?startSlide=48" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>6. キャッシュライン衝突</h2>
<p><strong> </strong></p>
<ul>
<strong> </strong>
<li><strong>不連続アクセスとは ( P.61, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=46m25s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>キャッシュメモリの構成 ( P.62, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=46m45s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>キャッシュとキャッシュライン ( P.63, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=47m50s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>キャッシュライン衝突の例 ( P.64, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=48m55s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>メモリ・インターリービング ( P.68, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=51m22s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>キャッシュライン衝突が起こる条件 ( P.69, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=52m02s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>キャッシュライン衝突への対応 ( P.70, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=53m10s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684388?startSlide=60" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>7. ブロック化</h2>
<ul>
<li><strong>ブロック化によるアクセス局所化 ( P.72, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=54m33s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>ブロック化によるキャッシュミスヒット削減例 ( P.73, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=55m02s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>配列とキャッシュライン構成の関係 ( P.74, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=55m44s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>行列-行列積の場合(ブロック化しない) ( P.75, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=55m54s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>行列-行列積の場合(ブロック化する:2要素) ( P.78, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=57m08s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>行列積コード(Ｃ言語) : キャッシュブロック化なし ( P.80, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=58m33s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>行列-行列積のブロック化のコード(Ｃ言語) ( P.81, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=58m42s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>行列-行列積のブロック化のコード(Fortran言語) ( P.82, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=59m12s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>キャッシュブロック化時のデータ・アクセスパターン ( P.83, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=59m25s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>行列-行列積のブロック化のコードのアンローリング(Ｃ言語) ( P.85, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=60m00s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>行列-行列積のブロック化のコードのアンローリング(Fortran言語) ( P.86, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=61m00s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684388?startSlide=71" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>8. その他の高速化技術</h2>
<ul>
<li><strong>共通部分式の削除 ( P.88, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=61m27s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>コードの移動 ( P.90, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=62m36s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>ループ中のIF文 ( P.91, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=63m50s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>ソフトウェア・パイプライニングの強化 ( P.92, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=65m10s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684388?startSlide=87" width="427"> </iframe></p>
<div></div>
<p> </p>
<hr />
<h2>9. 数値計算ライブラリの利用</h2>
<ul>
<li><strong>数値計算ライブラリ ( P.94, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=67m12s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>疎行列用ライブラリの特徴 ( P.95, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=68m28s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>BLAS ( P.96, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=70m36s"><strong>ビデオ画像 </strong></a><strong>)</strong></li>
<strong> </strong>
<li><strong>レベル1 BLAS ( P.98, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=71m58s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>レベル2 BLAS ( P.99, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=73m07s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>レベル3 BLAS ( P.100, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=74m33s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>典型的なBLASの性能 ( P.101, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=75m55s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>BLAS利用例 ( P.102, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=77m13s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>BLASの機能詳細 ( P.103, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=77m57s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<ul>
<li><strong id="__mce">GOTO BLASとは ( P.104, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=78m11s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>LAPACK ( P.105, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=78m43s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>LAPACKの命名規則 ( P.106, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=79m07s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>インタフェース例：DGESV ( P.107, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=79m10s"><strong>ビデオ画像 </strong></a><strong>)</strong></li>
<strong> </strong>
<li><strong>ScaLAPACK ( P.110, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=79m25s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>ScaLAPACKのソフトウェア構成図 ( P.111, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=80m10s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>BLACSとPBLAS ( P.112, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=81m00s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>ScaLAPACKの命名規則 ( P.113,　ビデオ画像 )</strong></li>
<strong> </strong>
<li><strong>インタフェース例：PDGESV ( P.114, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=81m04s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>BLAS利用の注意 ( P.118, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=81m30s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>レポート課題 ( P.119, </strong><a class="external-link" href="http://www.youtube.com/watch?v=6zd5PrSKRXo#t=83m30s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<div id="_mcePaste">
<table>
<tbody>
<tr>
<td class="xl65"></td>
</tr>
</tbody>
</table>
</div>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684388?startSlide=93" width="427"> </iframe></p>
<div></div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの最適化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    
      <dc:subject>配信講義A</dc:subject>
    
    <dc:date>2013-04-10T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/optimization2">
    <title>プログラム高速化の応用</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/optimization2</link>
    <description>2013年前期に行われたCMSI計算科学技術特論Aの講義「第5回 プログラム高速化の応用」をもとに、プログラム高速化に関して解説しています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27556527?startSlide=1" width="427"> </iframe></p>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<div>
<p> </p>
<hr />
<h2>1. 性能チューニングの応用</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> 性能チューニングに関する総論 ( P.4, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=0m50s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 状況に応じて変化していくホットスポット ( P.10, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=11m04s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ホットスポット判明後の最適化方針の一例 ( P.11, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=11m27s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ホットスポットをどのようにして知るのか ( P.14, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=17m42s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> その他の注意 ( P.15, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=20m04s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27556527?startSlide=3" width="427"> </iframe></p>
<div>
<p> </p>
<hr />
<h2>2. 性能プロファイリング</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> 性能プロファイリングの重要性 ( P.17, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=21m25s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 性能プロファイラでわかること ( P.18, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=22m29s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 性能プロファイラ（富士通FX10） ( P.19, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=23m16s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 性能プロファイラの種類の詳細 ( P.20, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=24m13s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 基本プロファイラ利用例（東大FX10） ( P.21, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=25m39s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 基本プロファイラ出力例（東大FX10） ( P.22, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=26m22s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li><strong> 詳細プロファイラ利用例（東大FX10） ( P.24, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=27m18s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 詳細プロファイラGUIによる表示例（東大FX10) ( P.26, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=28m30s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 詳細プロファイラで取れるデータ（東大FX10） ( P.28, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=29m16s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27556527?startSlide=16" width="427"> </iframe></p>
<div>
<p> </p>
<p> </p>
<hr />
<h2>3. そのほかの最適化技法</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> ループ分割とループ融合の実例 ( P.30, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=29m28s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ＦＸ１０での基本プロファイルによる全体時間 ( P.32, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=32m12s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ＦＸ１０基本プロファイルによる全体時間(通信時間) ( P.33, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=32m57s"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ＦＸ１０基本プロファイルによる主要関数 ( P.34, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=34m42s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> カーネルループの構造 ( P.39, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=35m17s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ここでのコード最適化の方針 ( P.40, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=35m44s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ループ分割の例 – 分割点 ( P.42, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=38m27s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ループ融合 – １重ループ化 ( P.43, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=38m55s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ループ融合 – ２重ループ化 ( P.44, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=39m53s"><span class="external-link"><strong>ビデオ画像</strong></span></a><span><strong> )</strong></span></li>
<li><strong> さらなる改良：定義－参照距離の変更 ( P.45, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=40m11s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 修正コード + I-ループ分割の例 ( P.46, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=40m58s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 修正コード + K-ループの分割の例 ( P.47, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=41m38s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> チューニングの可能性のあるコード例（経験的に決めた数例） ( P.48, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=41m55s"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ループ分割・ループ融合の効果 ( P.49, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=42m32s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> チューニングの結果 ( P.50, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=43m04s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong>＃１（ベースライン）に対する速度向上 ( P.51, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=43m52s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> #4のK-ループの分割のコード ( P.52, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=44m07s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> メニーコア環境でのループ融合への期待 ( P.53, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=44m25s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27556527?startSlide=29" width="427"> </iframe></p>
<div>
<p> </p>
<hr />
<h2>4. 通信最適化の方法</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> メッセージサイズと通信回数 ( P.55, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=46m34s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 通信最適化時に注意すること ( P.56, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=47m37s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 領域①となる通信の例 ( P.57, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=48m54s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27556527?startSlide=54" width="427"> </iframe></p>
<div>
<p> </p>
<hr />
<h2>5. 非同期通信：Isend、Irecv、永続的通信関数</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> ブロッキング通信で効率の悪い例 ( P.60, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=50m57s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27556527?startSlide=59" width="427"> </iframe></p>
<div>
<p> </p>
<hr />
<h2>6. １対１通信に対するMPI用語</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> ブロッキング、ノンブロッキング ( P.62, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=51m47s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ローカル、ノンローカル ( P.63, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=53m02s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 通信モード（送信発行時の場合） ( P.64, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=53m09s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 実例－MPI_Send ( P.65, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=54m05s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 非同期通信関数 ( P.67, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=54m36s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 同期待ち関数 ( P.68, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=55m33s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 実例－MPI_Isend ( P.69, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=56m00s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 注意点 ( P.70, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=56m46s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列化の注意（MPI_Send、MPI_Recv） ( P.71, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=57m05s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 非同期通信 TIPS ( P.72, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=58m39s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> MPI_Probe 関数 ( P.73, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=59m26s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> MPI_Iprobe関数 ( P.74, </strong><a class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li><strong> MPI_Cancel 関数 ( P.75, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=59m31s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ノン・ブロッキング通信例 ( P.76, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=59m33s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ノン・ブロッキング通信による改善 ( P.77, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=60m35s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 永続的通信 ( P.79, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=61m25s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 永続的通信の実装例 ( P.81, </strong><a class="external-link" href="http://www.youtube.com/watch?v=opWAP1z0tM0#t=66m57s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27556527?startSlide=61" width="427"> </iframe></p>
<div></div>
</div>
</div>
</div>
</div>
</div>
</div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの最適化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    
      <dc:subject>配信講義A</dc:subject>
    
    <dc:date>2013-05-15T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/8ot91v">
    <title>高速化チューニングとその関連技術2</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-opt/8ot91v</link>
    <description>2013年前期に行われたCMSI計算科学技術特論Aの講義「第9回 高速化チューニングとその関連技術2」をもとに、計算機の仕組み、プロファイラの使い方、メモリアクセス最適、CPUチューニング及び並列化に関して解説しています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684398?rel=0" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2" target="_blank" href="https://www.slideshare.net/cms_initiative/ss-26684398">CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<p> </p>
<hr />
<h2>1. 計算機の仕組み</h2>
<ul>
<li><strong>計算機の仕組みと高速化 ( P.3, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=1m08s"><strong><span class="external-link">ビデオ画像</span> </strong></a><strong>)</strong></li>
<strong> </strong>
<li><strong>プログラム階層 ( P.4, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=2m30s"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong>記憶階層 ( P.5, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=3m50s"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong>Byte/Flop ( P.6, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=5m18s"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong>仮想メモリとページング ( P.7, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=6m29s"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong>NUMA ( P.9, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=10m05s"><strong><span class="external-link">ビデオ画像</span> )</strong></a></li>
<strong> </strong>
<li><strong> CPUアーキテクチャ ( P.11, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=12m38s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong>レイテンシとパイプライン ( P.13, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=18m03s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong>積和(差)命令 fmaddd,fmsubd ( P.16, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=20m27s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<li><strong>SIMD ( P.17, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=21m16s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong>パイプラインのイメージ ( P18, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=22m24s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong>計算機の仕組みのまとめ ( P.19, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=23m17s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
</ul>
<ul>
</ul>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684398?rel=0&amp;startSlide=2" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2" target="_blank" href="https://www.slideshare.net/cms_initiative/ss-26684398">CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p> </p>
<hr />
<h2>2. プロファイラの使い方</h2>
<ul>
<li> <strong>プログラムのホットスポット ( P.21, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=25m00s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> プロファイラ ( P.22, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=26m46s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> プロファイラ(Sampler型) ( P.23, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=27m28s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong>gprof ( P.24, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=28m16s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 結果の解釈(Sampler型) ( P.25, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=29m23s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> プロファイラ(イベント取得型) ( P.26, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=30m06s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Profile結果の解釈(HW Counter) ( P.27, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=31m43s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
</ul>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684398?rel=0&amp;startSlide=20" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2" target="_blank" href="https://www.slideshare.net/cms_initiative/ss-26684398">CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p> </p>
<p> </p>
<hr />
<h2>3. メモリアクセス最適化</h2>
<ul>
<li> <strong>メモリ最適化1 セル情報の一次元実装 ( P.30, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=35m15s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> メモリ最適化2 相互作用ペアソート ( P.32, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=38m14s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> メモリ最適化3 空間ソート/作用反作用 ( P.34, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=40m24s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> メモリ最適化まとめ ( P.38, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=45m46s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
</ul>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684398?rel=0&amp;startSlide=28" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2" target="_blank" href="https://www.slideshare.net/cms_initiative/ss-26684398">CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p> </p>
<p> </p>
<hr />
<h2>4. CPUチューニング</h2>
<ul>
<li> <strong>CPUチューニング ( P.40, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=49m53s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 条件分岐コスト ( P.41, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=50m24s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 条件分岐削除 (Fortran言語) ( P.43, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=51m37s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> SIMD化 ( P.45, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=53m45s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> CPUチューニングまとめ ( P.49, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=59m20s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
</ul>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684398?rel=0&amp;startSlide=39" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2" target="_blank" href="https://www.slideshare.net/cms_initiative/ss-26684398">CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>
<p> </p>
<p> </p>
<hr />
<h2>5. 並列化</h2>
<ul>
<li> <strong>並列化、その前に ( P.51, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=60m35s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列化への心構え ( P.54, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=67m32s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> MPIとOpenMP ( P.56, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=70m45s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Flat MPIか、ハイブリッドか ( P.58, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=72m44s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ハイブリッド並列化 ( P.59, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=74m26s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> MPIを使う際の注意点 ( P.64, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=79m50s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 並列化のまとめ ( P.65, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=81m10s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 全体のまとめ ( P.66, </strong><a class="external-link" href="http://www.youtube.com/watch?v=q6_chmCi4TQ#t=82m20s"><span class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></span></a><strong> )</strong></li>
</ul>
<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/26684398?rel=0&amp;startSlide=50" width="427"> </iframe></p>
<div><b> <a title="CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2" target="_blank" href="https://www.slideshare.net/cms_initiative/ss-26684398">CMSI計算科学技術特論A(9) 高速化チューニングとその関連技術2</a> </b> from <b><a target="_blank" href="http://www.slideshare.net/cms_initiative">Computational Materials Science Initiative</a></b></div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>吉見一慶</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>アプリの最適化</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    
      <dc:subject>配信講義A</dc:subject>
    
    <dc:date>2013-06-12T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-implement/blaslapack1">
    <title>線形代数演算ライブラリBLASとLAPACKの基礎</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-implement/blaslapack1</link>
    <description>2013年前期に行われたCMSI計算科学技術特論Aの講義「第6回 線形代数演算ライブラリBLASとLAPACKの基礎と実践１」をもとに、線形代数演算ライブラリの基礎に関して解説しています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533624?startSlide=1" width="427"> </iframe></p>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<div>
<p> </p>
<hr />
<h2>1. 線形代数とその歴史</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> 線形代数とは ( P.4, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=2m27s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 線形代数の歴史と重要性 ( P.5, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=3m51s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 線形代数の利用例 ( P.10, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=6m25s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 九章算術（紀元前1世紀から紀元後2世紀ころ)、方程から ( P.14, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=8m55s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 九章算術（紀元前1世紀から紀元後2世紀ころ)、方程、中田+Google trans.訳 ( P.15, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=10m40s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ENIACで計算を行っている写真 ( P.17, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=14m55s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533624?startSlide=3" width="427"> </iframe>
<div>
<p> </p>
<hr />
<h2>2. コンピュータでの実数演算と線形代数演算について</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> コンピュータでの実数演算はどうするか ( P.19, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=16m53s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> コンピュータでの数の取り扱い:倍精度 ( P.24, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=20m17s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533624?startSlide=18" width="427"> </iframe>
<div>
<p> </p>
<hr />
<h2>3. コンピュータでの線形代数</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> 自作するのは難しいことがある ( P.26, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=26m14s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> BLAS,LAPACK:世界最高の線形代数演算パッケージ ( P.35, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=30m05s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> BLASとは？ ( P.42, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=33m00s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Level 1 BLAS ( P.47, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=37m11s" class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Level 2 BLAS ( P.48, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=40m10s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Level 3 BLAS ( P.49, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=41m04s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> BLASの命令規則とルーチン ( P.50, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=42m00s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> LAPACKとは？ ( P.51, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=45m40s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> BLAS,LAPACKを利用したソフトウェア ( P.52, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=50m30s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Top500 ( P.53, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=51m48s" class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> BLAS,LAPACKの現状:高速なBLAS,LAPACKについて ( P.54, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=53m38s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> BLAS,LAPACKを使う上での注意点 ( P.56, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=62m01s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> BLAS,LAPACKを使ってみる ( P.61, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=66m23s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> BLAS,LAPACKのインストール ( P.62, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=66m37s" class="external-link"><span class="external-link"><strong>ビデオ画像</strong></span></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列-行列の積 ( P.63, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=66m59s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列-行列の積のリスト ( P.65, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=69m26s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列-行列の積のコンパイルと実行 ( P.67, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=70m59s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> LAPACK実習:行列の固有ベクトル、固有値を求める:DSYEV ( P.68, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=71m34s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列の固有ベクトル、固有値を求めるDSYEV詳細 ( P.69, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=72m32s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 行列の対角化のリスト ( P.70, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=74m27s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 対称行列の対角化のコンパイルと実行 ( P.71, </strong><a href="http://www.youtube.com/watch?v=5inj7LS5rcU#t=75m44s" class="external-link"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533624?startSlide=25" width="427"> </iframe>
<div></div>
</div>
</div>
</div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>数値手法への実装</dc:subject>
    
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    
      <dc:subject>配信講義A</dc:subject>
    
    <dc:date>2013-05-22T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>


  <item rdf:about="http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-implement/blaslapack2">
    <title>線形代数演算ライブラリBLASとLAPACKの実践</title>
    <link>http://www.cms-initiative.jp/ja/research-support/develop-support/how-to-publish/develop-apps/apps-implement/blaslapack2</link>
    <description>2013年前期に行われたCMSI計算科学技術特論Aの講義「第7回 線形代数演算ライブラリBLASとLAPACKの基礎と実践2」をもとに、線形代数演算ライブラリの実践方法に関して解説しています。</description>
    <content:encoded xmlns:content="http://purl.org/rss/1.0/modules/content/"><![CDATA[<p><iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533623?startSlide=1" width="427"> </iframe></p>
<p>(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。</p>
<div>
<p> </p>
<hr />
<h2>1. コンピュータの簡単な仕組みについて</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> コンピュータの簡単な仕組み ( P.4, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=1m38s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> CPUのスピードについて ( P.5, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=3m37s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> メモリ(記憶装置)のスピードについて ( P.6, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=5m30s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> CPUとメモリのスピード比の変化 ( P.7, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=9m20s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533623?startSlide=3" width="427"> </iframe>
<div></div>
<p> </p>
<hr />
<h2>2. GPUについての紹介</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> GPUとは？GPGPUとは？ ( P.9, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=11m52s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> GPUの使い方 ( P.10, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=13m44s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> GPUはどうして高速か？ ( P.11, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=14m20s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533623?startSlide=8" width="427"> </iframe>
<div>
<p> </p>
<hr />
<h2>3. プログラムを速くするには？</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> プログラムを高速化する一般的な手法 ( P.14, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=17m57s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 今後、並列化プログラミングは必須になる ( P.16, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=21m51s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533623?startSlide=13" width="427"> </iframe>
<div>
<div></div>
<p> </p>
<hr />
<h2>4. 高速なBLAS LAPACKを使うには</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> 高速なBLAS LAPACKを使う ( P.18, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=23m25s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> FLOPS:マシンの性能の計り方のひとつ ( P.19, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=24m26s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Bytes per FLOPS ( P.20, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=26m12s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> DGEMM 行列-行列積 ( P.21, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=28m09s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> DGEMV : 行列ベクトル積 ( P.22, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=29m56s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 高速なBLAS、LAPACKの力を知る ( P.23, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=31m40s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 環境を整える ( P.24, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=33m20s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Reference BLASのDGEMM ( P.25, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=33m41s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> Ubuntu標準ATLASの行列-行列積 ( P.26, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=34m50s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ATLASの行列-行列積 ( P.27, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=36m33s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> GotoBLAS2の行列-行列積 ( P.28, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=37m50s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<li><strong> 高速なBLAS、LAPACKの力を知る: ( P.29, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=39m29s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> DGEMVを使う ( P.30, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=40m25s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ここまでのまとめ ( P.36, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=46m19s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533623?startSlide=17" width="427"> </iframe>
<div></div>
<p> </p>
<hr />
<h2>5. 高速化の手法</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> レジスタとアンローリング ( P.38, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=49m15s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> キャッシュ ( P.39, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=50m15s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> ブロック行列化 ( P.40, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=51m49s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> cuBLAS+行列-行列積編 ( P.42, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=55m40s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533623?startSlide=37" width="427"> </iframe>
<div></div>
<hr />
<h2>6. GPUでのBLAS(cuBLAS)</h2>
<strong> </strong>
<ul>
<strong> </strong>
<li><strong> GPUの使い方:GPUの弱点 ( P.44, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=56m37s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> cuBLASとはなにか？(まずはBLAS) ( P.45, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=57m41s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> cuBLASとは何か ( P.46, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=57m53s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> cuBLASでの行列-行列積 ( P.47, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=58m44s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
<strong> </strong>
<li><strong> 難しい問題 ( P.54, </strong><a class="external-link" href="http://www.youtube.com/watch?v=JwZ_EdEQPl8#t=67m30s"><strong>ビデオ画像</strong></a><strong> )</strong></li>
</ul>
<p> </p>
<iframe frameborder="0" height="356" marginheight="0" marginwidth="0" scrolling="no" src="http://www.slideshare.net/slideshow/embed_code/27533623?startSlide=43" width="427"> </iframe>
<div></div>
</div>
</div>
</div>]]></content:encoded>
    <dc:publisher>No publisher</dc:publisher>
    <dc:creator>admin</dc:creator>
    <dc:rights></dc:rights>
    
      <dc:subject>数値手法への実装</dc:subject>
    
    
      <dc:subject>Web講習会</dc:subject>
    
    
      <dc:subject>人材育成・教育</dc:subject>
    
    
      <dc:subject>配信講義A</dc:subject>
    
    <dc:date>2013-05-29T15:00:00Z</dc:date>
    <dc:type>ページ</dc:type>
  </item>





</rdf:RDF>
