bate's blog

調べたこと実装したことなどを取りとめもなく書きます。

2013-04-13から1日間の記事一覧

cuda

サンプルを弄ってみた。 CPUで配列を0に初期化してGPUに渡す。GPUでスレッドインデックスを配列に代入。 GPUバッファをCPUの配列にコピーしてGPUの処理が反映されたものを取得できる。 #include <stdio.h> /** * @brief GPUで実行する関数. */ __global__ void setInd</stdio.h>…

ストレス

ストレスが溜まる一方。 効率を上げることに失敗したなら放置せずに元に戻すか別の方法に切り替えて欲しい。 GPGPUでもしようとcuda5.0を落とそうとしたら残り8時間とか出た。 cudaよりもOpenACCの方が汎用的で良いのかしらん。 OpenMPやらOpenACCやら覚えて…