2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

Intelの次世代技術について語ろう 84

1 :Socket774:2015/12/28(月) 12:04:52.28 ID:dApwbIRy.net
Intelの次世代製品や、それに関連する技術についてのスレッドです

■前スレ(直近スレ)
Intelの次世代技術について語ろう 82
http://anago.2ch.net/test/read.cgi/jisaku/1435117330/
Intelの次世代技術について語ろう 83
http://potato.2ch.net/test/read.cgi/jisaku/1442423228/

41 :,,・´∀`・,,)っ-○○○:2015/12/29(火) 20:35:45.48 ID:WWMpti8Z.net
EVEXのL':"L

00: 128b or scalar
01: 256b
10: 512b
11: #UD

普通に考えれば1024は11を使うんじゃない?
以前のスライドではSIMD FPは1024ビットまで拡張プランはあるが
整数は512ビットまでになっていた。

42 :Socket774:2015/12/29(火) 20:39:15.50 ID:pi0cgvF2.net
ふ〜ん
出るのは何年後だろう

43 :Socket774:2015/12/29(火) 20:41:03.76 ID:pi0cgvF2.net
float 32個
double 16個


quad 8個も?

44 :,,・´∀`・,,)っ-○○○:2015/12/29(火) 20:49:48.54 ID:WWMpti8Z.net
整数1024ビットレジスタだといろいろ面白いことができるんですけどね
たとえば8ビット×256要素のテーブルを2レジスタで表現できるので
AESライクないろんなブロック暗号の処理がソフト実装で高速化できる

45 :,,・´∀`・,,)っ-○○○:2015/12/29(火) 20:51:56.27 ID:WWMpti8Z.net
まあ、クロスバーの実装が大変そうだけども

46 :Socket774:2015/12/29(火) 21:00:27.90 ID:6qPjEUBd.net
>>29
普通に正論でワロタw

47 :Socket774:2015/12/29(火) 21:06:24.71 ID:pi0cgvF2.net
>>44
1024bitで出来るなら512bitでも出来るでしょ

48 :Socket774:2015/12/29(火) 21:08:53.22 ID:pi0cgvF2.net
>>29
まあ普通は行列積だけ計算して終わりなんてことは無いからね
CPUでやる場合も

49 :,,・´∀`・,,)っ-○○○:2015/12/29(火) 21:16:50.93 ID:WWMpti8Z.net
行列はサイズが大きくなるほどFLOPs/Bytesが大きくなるので
ある程度のサイズのローカルメモリがあれば通信帯域のボトルネックが
相対的に小さくなる。

小さい行列だとまったく逆の原理が働く
じゃあ大量の小さい行列で何をするの?
レイトレーシングならCPUのほうが分があると思うけどなぁ

50 :Socket774:2015/12/29(火) 21:37:35.95 ID:aIniuvLO.net
>>47
vpermbみたいな命令でテーブルルックアップやるときはレジスタが大きければ大きいほどいい
小さいとインデックスの範囲での場合分けが面倒になる
8bit256要素だったらレジスタが1024bitあれば
インデックスの最上位ビットだけ取り出してマスクレジスタにセットすれば
プレディケーション付きvpermb2つとvporで3命令かな

総レス数 1002
215 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★