かえるのクーの助手たち

我々は賢くないので。。。

Qiita に記事をかいてみる

やっぱり敷居が高いかもしれません

こんにちわ、こんばんわ。かえるのクーの助手の「井戸中 聖」(いとなか あきら)でございます。

f:id:AssistantOfKoo:20210310231358p:plain

一度書いてみたかったQiitaに記事をかいてみました。

とりとめのないTIPSなのですが、検索しても同じような情報はなさそうだったので入力してみました。

自分としては、技術系より「なんでもあり」のBlogのほうが性に合っている感じがします。マークダウン形式で書くやり方はまだまだ慣れません。

さて

現在は購入したRTX3060/12GB/3,584Core/12.74 TFLOPSでのcuda性能の確認などをしています。

以前使っていた GTX 1060/6GB/1,280Core/4.4TFLOPSから比べると cudaコア数もメモリも倍増していますが、数値ほどは「速くなった!」と印象は受けません。う~ん、なぜでしょう。(とはいえ、Google Colabでの TESLA T4/16GB/2,560Core/8.1TFLOPSより速い!のは実測でも間違いありません)

12GBではやっぱりすぐに「メモリ不足エラー」が発生してしまいます。Unified Memory 指定をしているのですが、確かに使用できる配列サイズは「すこし」増えるのですが、満足には程遠い状況です。これは、TESLA T4でも同じです。Unified Memory指定は何倍も配列を使うことができるイメージがあったのですが、確認では1割~2割程度しか限界が伸びません。どこか指定がおかしいのかもしれません。(現時点ではCuPy経由での指定をしています)

Unified Memoryは以下を参照ください。話題のResizableBARとは別物です。

個人的には Unified Memory + ResizableBARでたいへんメモリ廻り:GPU/CPUメモリ間の転送の改善を期待していました。
現在ResizableBARを(資源不足により)実現できていないので、確認できていません。

GPGPUで遊びたいときは、やっぱりTESLAとかQuadroとか Titan シリーズでないと満足できないのでしょうか???いえ、使い方を工夫すれば、十分遊べるはずです!!

RTX3060のグラフィック性能はとてもよいです

ゲームはやらないのですが、FFベンチなどを動かすと、「とても快適」で楽しいです。

現在の価格に見合うか?は世間の評判ではとても微妙みたいです。

 ところで

はやく1枚で富岳くらいの計算ができるGPUカードがでてきてほしいものです。

でも、普通に考えてもあと18年*1はかかりそうです。。。とほほ。。。

 

 

*1:2002年 Top1の NEC 地球シミュレータ 35.86TFLOPSから RTX3090 単精度35.7 TFLOPS まで 18年かかっているので、富岳くらいの性能の1ボードGPUがでるのは 2040年あたりになりそうです。