2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

Intelの次世代技術について語ろう 84

1 :Socket774:2015/12/28(月) 12:04:52.28 ID:dApwbIRy.net
Intelの次世代製品や、それに関連する技術についてのスレッドです

■前スレ(直近スレ)
Intelの次世代技術について語ろう 82
http://anago.2ch.net/test/read.cgi/jisaku/1435117330/
Intelの次世代技術について語ろう 83
http://potato.2ch.net/test/read.cgi/jisaku/1442423228/

791 :Socket774:2016/02/25(木) 01:53:07.71 ID:8jTkbNAE.net
足回りの進化が停滞し過ぎてて

792 :Socket774:2016/02/25(木) 01:53:40.86 ID:eTDmpqiV.net
感覚的には行列の時点で既に演算ヘビー、メモリライトだな。
それよりももっと演算ヘビーの需要が多いんだと主張してるのか。
左ばっかりで中道でも右扱いされるどっかの国か

793 :Socket774:2016/02/25(木) 02:13:08.84 ID:oW1sIAUY.net
帯域喰いのGPUが統合されたからこれからはHBMでもHMCでも積んでくるだろう

794 :,,・´∀`・,,)っ-○○○:2016/02/25(木) 02:24:21.68 ID:0CfRNqM+.net
> 感覚的には行列の時点で既に演算ヘビー、メモリライトだな。

それは密行列
いまどきのスパコンで行列積問題といったらSpMVのことでしょ
LINPACKベンチなんざランキング以外になんの価値がある?

つーかAVX-512は単純にベクタ幅2倍でFP性能2倍ばかり言われるが
レジスタの本数強化やプレディケートマスクのサポートによる
垂直演算密度の向上などによるところも性能向上要素としては大きいので
別に512ビットがフルに使える帯域がなければ即役に立たない代物ではないでしょ

GeForce Titan Xが330GB/sに対して単精度7TFLOPSだから
CannonlakeのBytes/FLOPSが極端に悪いわけではない

795 :Socket774:2016/02/25(木) 02:58:06.68 ID:eTDmpqiV.net
ノード間結合網に関して手抜きをできないのはHPLよりもHPCGなわけで
それはHPCGの方がデータ移動が重いからじゃないのかな

796 :Socket774:2016/02/25(木) 07:57:55.09 ID:mQs7BElF.net
>>794
疎行列の計算は軽いと思ってるの?

797 :Socket774:2016/02/25(木) 08:08:54.22 ID:mQs7BElF.net
ていうか、団子は4x4までの行列しか使わないんじゃなかったの?

798 :Socket774:2016/02/25(木) 09:00:34.42 ID:QAWeo+6F.net
軽いとか重いとかいう表現は定量的じゃないから議論の意味が無いよ
○○の分野ではサイズどれ位でスパースネスこれ位が一般的だから
メモリ帯域がボトルネックになる、
とかでないならコンニャク問答にしかならん

799 :Socket774:2016/02/25(木) 09:05:21.40 ID:4YpYJUJo.net
eyerissの資料見ると計算するよりメモリ読む方が電力食うから
帯域節約していく方向にしないとえらいことになるな

800 :,,・´∀`・,,)っ-○○○:2016/02/25(木) 11:30:02.78 ID:1tZnPIvb.net
粗行列はどっかの知恵遅れに理解できないGatherのコストが問われる問題

総レス数 1002
215 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★