２ちゃんねるスマホ用 ■掲示板に戻る■ 全部 1- 最新50

■ このスレッドは過去ログ倉庫に格納されています

Intelの次世代技術について語ろう 84

1 ：Socket774：2015/12/28(月) 12:04:52.28 ID:dApwbIRy.net: Intelの次世代製品や、それに関連する技術についてのスレッドです

■前スレ(直近スレ)
Intelの次世代技術について語ろう 82
http://anago.2ch.net/test/read.cgi/jisaku/1435117330/
Intelの次世代技術について語ろう 83
http://potato.2ch.net/test/read.cgi/jisaku/1442423228/
41 ：,,・´∀｀・,,）っ-○○○：2015/12/29(火) 20:35:45.48 ID:WWMpti8Z.net: EVEXのL':"L

00: 128b or scalar
01: 256b
10: 512b
11: #UD

普通に考えれば1024は11を使うんじゃない？
以前のスライドではSIMD FPは1024ビットまで拡張プランはあるが
整数は512ビットまでになっていた。
42 ：Socket774：2015/12/29(火) 20:39:15.50 ID:pi0cgvF2.net: ふ～ん
出るのは何年後だろう
43 ：Socket774：2015/12/29(火) 20:41:03.76 ID:pi0cgvF2.net: float 32個
double 16個
か

quad 8個も？
44 ：,,・´∀｀・,,）っ-○○○：2015/12/29(火) 20:49:48.54 ID:WWMpti8Z.net: 整数1024ビットレジスタだといろいろ面白いことができるんですけどね
たとえば8ビット×256要素のテーブルを2レジスタで表現できるので
AESライクないろんなブロック暗号の処理がソフト実装で高速化できる
45 ：,,・´∀｀・,,）っ-○○○：2015/12/29(火) 20:51:56.27 ID:WWMpti8Z.net: まあ、クロスバーの実装が大変そうだけども
46 ：Socket774：2015/12/29(火) 21:00:27.90 ID:6qPjEUBd.net: >>29
普通に正論でワロタw
47 ：Socket774：2015/12/29(火) 21:06:24.71 ID:pi0cgvF2.net: >>44
1024bitで出来るなら512bitでも出来るでしょ
48 ：Socket774：2015/12/29(火) 21:08:53.22 ID:pi0cgvF2.net: >>29
まあ普通は行列積だけ計算して終わりなんてことは無いからね
CPUでやる場合も
49 ：,,・´∀｀・,,）っ-○○○：2015/12/29(火) 21:16:50.93 ID:WWMpti8Z.net: 行列はサイズが大きくなるほどFLOPs/Bytesが大きくなるので
ある程度のサイズのローカルメモリがあれば通信帯域のボトルネックが
相対的に小さくなる。

小さい行列だとまったく逆の原理が働く
じゃあ大量の小さい行列で何をするの？
レイトレーシングならCPUのほうが分があると思うけどなぁ
50 ：Socket774：2015/12/29(火) 21:37:35.95 ID:aIniuvLO.net: >>47
vpermbみたいな命令でテーブルルックアップやるときはレジスタが大きければ大きいほどいい
小さいとインデックスの範囲での場合分けが面倒になる
8bit256要素だったらレジスタが1024bitあれば
インデックスの最上位ビットだけ取り出してマスクレジスタにセットすれば
プレディケーション付きvpermb2つとvporで3命令かな

総レス数 1002
215 KB

新着レスの表示

掲示板に戻る全部前100 次100 最新50

read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★