2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【完全無欠超絶大勝利】Zen夜祭【真のCPU最強伝説】

1 :Socket774:2015/07/06(月) 09:57:10.61 ID:ogyA84h+.net
ここにx86-64/128の覇者が誕生する
天才の作りし芸術品よ

881 :Socket774:2016/12/13(火) 17:08:26.75 ID:LmhzwTMz.net
配信見るためには事前登録必要なのかこれ?

882 :Socket774:2016/12/13(火) 17:14:13.33 ID:zp4mmwfd.net
zenzen期待してないんだからねっ

883 :Socket774:2016/12/13(火) 17:22:21.63 ID:Ygu4i7eN.net
>>874
> bdファミリでもZenでも256ビットSIMD命令は単純な操作でも2サイクルかけて2命令で実行される。

これをFPスケジューラで並行実行するだけじゃないの

884 :,,・´∀`・,,)っ-○○○:2016/12/13(火) 17:40:49.96 ID:PDmxY+Gj.net
たとえば、1イテレーションあたり128ビットAVXで10命令、256ビットAVX*で12命令かかる操作なんてのがあるとする。
簡単にいえば、128ビット単位でシーケンシャル処理してたものを更に2並列化するのにかかるコストだな。

その場合、ネイティヴ256ビットSIMDの実装なら、128ビット単位の処理と比較して一度に扱えるデータ量が2倍に増えるからトータル1.7倍弱程度の性能向上となるわけ。
でもZenの場合は256ビットSIMD命令が分割実行だから24命令かけて20命令でできることをやるわけ。

追加コストの払い損ですな。

もちろん複数命令のインターリーブによって実効スループットが向上する効果がないわけではないが
x264/x265でやってるような大概のSIMD整数演算はもともとレイテンシが小さいので殆ど効果がない。

つーか、256ビットSIMD対応することで遅くなる原因がなんだと思ってたんですかねえ?

885 :,,・´∀`・,,)っ-○○○:2016/12/13(火) 17:44:34.45 ID:PDmxY+Gj.net
同じことはSSEの128ビット化でも通った道だ
256ビットSIMDを効率的に実行するにはネイティヴ256ビット以外にない

886 :,,・´∀`・,,)っ-○○○:2016/12/13(火) 17:48:00.81 ID:PDmxY+Gj.net
>>883
お前の解釈だとBulldozerもZenも「依存関係のない128ビット命令」を2並列で実行できないんですか?
HaswellもFMA2基構成だが256ビットFMAを2並列で実行できる(つまり512ビット分のスループット)よ?

887 :Socket774:2016/12/13(火) 17:49:51.19 ID:U4ADC+dz.net
必死だな田村

888 :Socket774:2016/12/13(火) 17:59:31.17 ID:Ygu4i7eN.net
だから「できたら」って言ってるじゃん
それにIntelをもってしてもFPの命令充填率はそう高くなさそうだが

889 :,,・´∀`・,,)っ-○○○:2016/12/13(火) 18:07:49.72 ID:PDmxY+Gj.net
ちなみに10命令と12命令は架空の話じゃなくて現実のコードの話だ。
そしてCarrizoで遅くなる現象も確認している。
単純な話だ、128ビットに比べて命令数が増えてるから遅い。

890 :Socket774:2016/12/13(火) 18:12:12.79 ID:23W0CcB9.net
つまらん、お前の話しはつまらん

総レス数 1003
185 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★