2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

CPUアーキテクチャについて語れ 32

1 :Socket774:2016/06/30(木) 07:54:33.43 ID:aXREhEqB.net
【前スレ】
CPUアーキテクチャについて語れ 31
http://potato.2ch.net/test/read.cgi/jisaku/1447725141/

901 :Socket774:2016/11/15(火) 22:07:15.44 ID:+XqBVYnA.net
https://www.slideshare.net/mobile/insideHPC/nvidia-sc16-the-greatest-challenges-cant-wait

おもしろそうなセッションはあるかな
http://www.nvidia.com/object/supercomputing2016.htm#

902 :Socket774:2016/11/15(火) 22:09:09.28 ID:H0xwit1w.net
・・・・まあ流れがよくわからんが、スイスのXC50すげえと言ってもさ
そのCrayはオーダーはKNLの方が多いよと言ってるんで
持ち上げると墓穴掘ることになるだけなよーな

今回のランキング見ても思ったけども、Xeonが増えてて
アクセラレータつうかGPUが減らしてるんよね

903 :Socket774:2016/11/15(火) 22:15:10.36 ID:+XqBVYnA.net
アクセラレータにも汎用にもなれない中途半端なphi

904 :Socket774:2016/11/15(火) 22:42:24.53 ID:6Fhr9eXM.net
LINPACK専用ハードウェアアクセラレータみたいなのはもし作ってもベンチマーク以外の利用方法がおもいつかんが、
ディープラーニング専用ハードウェアアクセラレーターは開発すれば利用価値ありそう

LINPACKじゃなく、ディープラーニング性能を計測する標準的なベンチマークって無いの?

905 :Socket774:2016/11/15(火) 22:52:58.25 ID:fmu71H73.net
ディープラーニングはgemmだから一番時間かかる部分はLINPACKとほぼ同じだよ。

906 :Socket774:2016/11/15(火) 23:11:14.59 ID:BI+nTQQU.net
>BaiduはDeepBenchと呼ぶベンチマークを発表しました。DeepBenchはディープ
>ラーニングの処理を実行するハードウェアの基本的な性能を測るベンチマークで,
>CaffeやTensorFlowなどのフレームワークは含んでいません。

>フレームワークレベルになると,やり方が色々とあり,ハードウェアだけの
>性能が比較できないので,DeepBenchでは,密行列積,畳み込み,
>リカーレント層の処理,オールリデュースの性能を測っています。

>NVIDIAのTitanXとIntelのKNLの幾つかの測定値が載っていますが,
>入力のサイズがまちまちなので,どう比べたら良いのか,よくわかりません。

ttp://www.geocities.jp/andosprocinfo/wadai16/20161001.htm

907 :Socket774:2016/11/15(火) 23:41:17.38 ID:H0xwit1w.net
>>904
もうそういうのに取り組んでるところあるよ、国内だと東芝がやってる

908 :,,・´∀`・,,)っ-○○○:2016/11/16(水) 12:39:24.79 ID:3qXPlRtE.net
機械翻訳くんがDeepBenchはAMDのGPUでも動くと豪語したけど音沙汰ありませんね

909 :,,・´∀`・,,)っ-○○○:2016/11/16(水) 12:44:56.01 ID:3qXPlRtE.net
DLも扱うのはむしろ疎行列寄りじゃね?
GEMMでも疎行列積をとれないことはないが0.0*nをなん度も繰り返すことになって無駄なだけだよ

910 :Socket774:2016/11/16(水) 14:16:52.98 ID:zJSnAE0d.net
そうなの?よく知らないけど何回も畳み込みしたら0は減っていきそうだけど。

総レス数 1000
232 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★