■ このスレッドは過去ログ倉庫に格納されています
CPUアーキテクチャについて語れ 32
- 1 :Socket774:2016/06/30(木) 07:54:33.43 ID:aXREhEqB.net
- 【前スレ】
CPUアーキテクチャについて語れ 31
http://potato.2ch.net/test/read.cgi/jisaku/1447725141/
- 901 :Socket774:2016/11/15(火) 22:07:15.44 ID:+XqBVYnA.net
- https://www.slideshare.net/mobile/insideHPC/nvidia-sc16-the-greatest-challenges-cant-wait
おもしろそうなセッションはあるかな
http://www.nvidia.com/object/supercomputing2016.htm#
- 902 :Socket774:2016/11/15(火) 22:09:09.28 ID:H0xwit1w.net
- ・・・・まあ流れがよくわからんが、スイスのXC50すげえと言ってもさ
そのCrayはオーダーはKNLの方が多いよと言ってるんで
持ち上げると墓穴掘ることになるだけなよーな
今回のランキング見ても思ったけども、Xeonが増えてて
アクセラレータつうかGPUが減らしてるんよね
- 903 :Socket774:2016/11/15(火) 22:15:10.36 ID:+XqBVYnA.net
- アクセラレータにも汎用にもなれない中途半端なphi
- 904 :Socket774:2016/11/15(火) 22:42:24.53 ID:6Fhr9eXM.net
- LINPACK専用ハードウェアアクセラレータみたいなのはもし作ってもベンチマーク以外の利用方法がおもいつかんが、
ディープラーニング専用ハードウェアアクセラレーターは開発すれば利用価値ありそう
LINPACKじゃなく、ディープラーニング性能を計測する標準的なベンチマークって無いの?
- 905 :Socket774:2016/11/15(火) 22:52:58.25 ID:fmu71H73.net
- ディープラーニングはgemmだから一番時間かかる部分はLINPACKとほぼ同じだよ。
- 906 :Socket774:2016/11/15(火) 23:11:14.59 ID:BI+nTQQU.net
- >BaiduはDeepBenchと呼ぶベンチマークを発表しました。DeepBenchはディープ
>ラーニングの処理を実行するハードウェアの基本的な性能を測るベンチマークで,
>CaffeやTensorFlowなどのフレームワークは含んでいません。
>フレームワークレベルになると,やり方が色々とあり,ハードウェアだけの
>性能が比較できないので,DeepBenchでは,密行列積,畳み込み,
>リカーレント層の処理,オールリデュースの性能を測っています。
>NVIDIAのTitanXとIntelのKNLの幾つかの測定値が載っていますが,
>入力のサイズがまちまちなので,どう比べたら良いのか,よくわかりません。
ttp://www.geocities.jp/andosprocinfo/wadai16/20161001.htm
- 907 :Socket774:2016/11/15(火) 23:41:17.38 ID:H0xwit1w.net
- >>904
もうそういうのに取り組んでるところあるよ、国内だと東芝がやってる
- 908 :,,・´∀`・,,)っ-○○○:2016/11/16(水) 12:39:24.79 ID:3qXPlRtE.net
- 機械翻訳くんがDeepBenchはAMDのGPUでも動くと豪語したけど音沙汰ありませんね
- 909 :,,・´∀`・,,)っ-○○○:2016/11/16(水) 12:44:56.01 ID:3qXPlRtE.net
- DLも扱うのはむしろ疎行列寄りじゃね?
GEMMでも疎行列積をとれないことはないが0.0*nをなん度も繰り返すことになって無駄なだけだよ
- 910 :Socket774:2016/11/16(水) 14:16:52.98 ID:zJSnAE0d.net
- そうなの?よく知らないけど何回も畳み込みしたら0は減っていきそうだけど。
総レス数 1000
232 KB
新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★