GPUマシンの設定で嵌った

昨日,研究用にGPUマシンを導入するためにマシンの設定を行っていたのだが,どうにもうまくいかなかった.

ドライバとかライブラリはちゃんとコンパイル出来てるっぽいんだけど,CUDA SDKのサンプルがうまく実行できないという.

C/ の下に入っているのはうまくいったんだけど,CUDALibraries/ の方が初期化処理でとまってしまう謎.

色々原因を追求していくと,NISユーザではうまくいかないけれど,何故かローカルユーザではうまくいくことを発見した.

NISユーザとローカルユーザで違うところは,ユーザ情報をNISで引いていることとhomeディレクトリがNFSマウントかローカルかというあたり.

ユーザ名,ユーザID,グループIDをまったく同一にしたユーザを作ってサンプルを動かしてみたら無事動いたので,どうやらNFSマウントしたホームディレクトリに問題がありそうということに.

それで頑張って調べていたら,以下の環境変数を見つけた.

CUDA_CACHE_DISABLE=1

これを設定すると何故かうまくいきだたしました.

同じことで悩んでいる人がもしかしたらいるかもしれないのでメモしておく.