■ このスレッドは過去ログ倉庫に格納されています
Intelの次世代技術について語ろう 84
- 1 :Socket774:2015/12/28(月) 12:04:52.28 ID:dApwbIRy.net
- Intelの次世代製品や、それに関連する技術についてのスレッドです
■前スレ(直近スレ)
Intelの次世代技術について語ろう 82
http://anago.2ch.net/test/read.cgi/jisaku/1435117330/
Intelの次世代技術について語ろう 83
http://potato.2ch.net/test/read.cgi/jisaku/1442423228/
- 41 :,,・´∀`・,,)っ-○○○:2015/12/29(火) 20:35:45.48 ID:WWMpti8Z.net
- EVEXのL':"L
00: 128b or scalar
01: 256b
10: 512b
11: #UD
普通に考えれば1024は11を使うんじゃない?
以前のスライドではSIMD FPは1024ビットまで拡張プランはあるが
整数は512ビットまでになっていた。
- 42 :Socket774:2015/12/29(火) 20:39:15.50 ID:pi0cgvF2.net
- ふ〜ん
出るのは何年後だろう
- 43 :Socket774:2015/12/29(火) 20:41:03.76 ID:pi0cgvF2.net
- float 32個
double 16個
か
quad 8個も?
- 44 :,,・´∀`・,,)っ-○○○:2015/12/29(火) 20:49:48.54 ID:WWMpti8Z.net
- 整数1024ビットレジスタだといろいろ面白いことができるんですけどね
たとえば8ビット×256要素のテーブルを2レジスタで表現できるので
AESライクないろんなブロック暗号の処理がソフト実装で高速化できる
- 45 :,,・´∀`・,,)っ-○○○:2015/12/29(火) 20:51:56.27 ID:WWMpti8Z.net
- まあ、クロスバーの実装が大変そうだけども
- 46 :Socket774:2015/12/29(火) 21:00:27.90 ID:6qPjEUBd.net
- >>29
普通に正論でワロタw
- 47 :Socket774:2015/12/29(火) 21:06:24.71 ID:pi0cgvF2.net
- >>44
1024bitで出来るなら512bitでも出来るでしょ
- 48 :Socket774:2015/12/29(火) 21:08:53.22 ID:pi0cgvF2.net
- >>29
まあ普通は行列積だけ計算して終わりなんてことは無いからね
CPUでやる場合も
- 49 :,,・´∀`・,,)っ-○○○:2015/12/29(火) 21:16:50.93 ID:WWMpti8Z.net
- 行列はサイズが大きくなるほどFLOPs/Bytesが大きくなるので
ある程度のサイズのローカルメモリがあれば通信帯域のボトルネックが
相対的に小さくなる。
小さい行列だとまったく逆の原理が働く
じゃあ大量の小さい行列で何をするの?
レイトレーシングならCPUのほうが分があると思うけどなぁ
- 50 :Socket774:2015/12/29(火) 21:37:35.95 ID:aIniuvLO.net
- >>47
vpermbみたいな命令でテーブルルックアップやるときはレジスタが大きければ大きいほどいい
小さいとインデックスの範囲での場合分けが面倒になる
8bit256要素だったらレジスタが1024bitあれば
インデックスの最上位ビットだけ取り出してマスクレジスタにセットすれば
プレディケーション付きvpermb2つとvporで3命令かな
総レス数 1002
215 KB
新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★