２ちゃんねるスマホ用 ■掲示板に戻る■ 全部 1- 最新50

■ このスレッドは過去ログ倉庫に格納されています

【完全無欠超絶大勝利】Zen夜祭【真のCPU最強伝説】

1 ：Socket774：2015/07/06(月) 09:57:10.61 ID:ogyA84h+.net: ここにx86-64/128の覇者が誕生する
天才の作りし芸術品よ
881 ：Socket774：2016/12/13(火) 17:08:26.75 ID:LmhzwTMz.net: 配信見るためには事前登録必要なのかこれ？
882 ：Socket774：2016/12/13(火) 17:14:13.33 ID:zp4mmwfd.net: zenzen期待してないんだからねっ
883 ：Socket774：2016/12/13(火) 17:22:21.63 ID:Ygu4i7eN.net: >>874
＞　bdファミリでもZenでも256ビットSIMD命令は単純な操作でも2サイクルかけて2命令で実行される。

これをFPスケジューラで並行実行するだけじゃないの
884 ：,,・´∀｀・,,）っ-○○○：2016/12/13(火) 17:40:49.96 ID:PDmxY+Gj.net: たとえば、1イテレーションあたり128ビットAVXで10命令、256ビットAVX*で12命令かかる操作なんてのがあるとする。
簡単にいえば、128ビット単位でシーケンシャル処理してたものを更に2並列化するのにかかるコストだな。

その場合、ネイティヴ256ビットSIMDの実装なら、128ビット単位の処理と比較して一度に扱えるデータ量が2倍に増えるからトータル1.7倍弱程度の性能向上となるわけ。
でもZenの場合は256ビットSIMD命令が分割実行だから24命令かけて20命令でできることをやるわけ。

追加コストの払い損ですな。

もちろん複数命令のインターリーブによって実効スループットが向上する効果がないわけではないが
x264/x265でやってるような大概のSIMD整数演算はもともとレイテンシが小さいので殆ど効果がない。

つーか、256ビットSIMD対応することで遅くなる原因がなんだと思ってたんですかねえ？
885 ：,,・´∀｀・,,）っ-○○○：2016/12/13(火) 17:44:34.45 ID:PDmxY+Gj.net: 同じことはSSEの128ビット化でも通った道だ
256ビットSIMDを効率的に実行するにはネイティヴ256ビット以外にない
886 ：,,・´∀｀・,,）っ-○○○：2016/12/13(火) 17:48:00.81 ID:PDmxY+Gj.net: >>883
お前の解釈だとBulldozerもZenも「依存関係のない128ビット命令」を2並列で実行できないんですか？
HaswellもFMA2基構成だが256ビットFMAを2並列で実行できる（つまり512ビット分のスループット）よ？
887 ：Socket774：2016/12/13(火) 17:49:51.19 ID:U4ADC+dz.net: 必死だな田村
888 ：Socket774：2016/12/13(火) 17:59:31.17 ID:Ygu4i7eN.net: だから「できたら」って言ってるじゃん
それにIntelをもってしてもFPの命令充填率はそう高くなさそうだが
889 ：,,・´∀｀・,,）っ-○○○：2016/12/13(火) 18:07:49.72 ID:PDmxY+Gj.net: ちなみに10命令と12命令は架空の話じゃなくて現実のコードの話だ。
そしてCarrizoで遅くなる現象も確認している。
単純な話だ、128ビットに比べて命令数が増えてるから遅い。
890 ：Socket774：2016/12/13(火) 18:12:12.79 ID:23W0CcB9.net: つまらん、お前の話しはつまらん

総レス数 1003
185 KB

新着レスの表示

掲示板に戻る全部前100 次100 最新50

read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★