■ このスレッドは過去ログ倉庫に格納されています
AMDの次世代APU/CPU/SoCについて語ろう 240世代
- 1 :Socket774:2016/01/29(金) 00:11:59.03 ID:RwF1kB3C.net
- .___
\._ | 荒らし・煽り・厨房は放置が一番。
/|_| | 釣られずにスルーしましょう。
|_/\! sage進行でマターリいきますお
※前スレ
AMDの次世代APU/CPU/SoCについて語ろう 238世代 [無断転載禁止]?2ch.net
http://potato.2ch.net/test/read.cgi/jisaku/1453415652/
※機械翻訳は、こちらへ
AMDの次世代APU/CPU/SoCについて翻訳しよう
http://potato.2ch.net/test/read.cgi/jisaku/1452070219/l50
- 821 :Socket774:2016/02/06(土) 09:09:51.93 ID:bhC2/RiY.net
- そもそもmaxwellでは半精度の演算はできませんけどね
FP16のストレージは使えるけど
この点tongaから半精度演算も対応してるんですけどね
radeonは
- 822 :Socket774:2016/02/06(土) 09:17:06.39 ID:8NLnYcGb.net
- GK110は倍精度専用演算ユニットがあるからFP32の電力効率は影響しない作りになってるよ
アーキテクチャの改良ではなくアーキテクチャの違いによってだね
- 823 :Socket774:2016/02/06(土) 09:17:53.68 ID:fbgobFh5.net
- >>820
DPユニット : double precision ユニット
P/W : Performance ÷ Watt
で合ってる?
- 824 :Socket774:2016/02/06(土) 09:39:46.25 ID:8NLnYcGb.net
- 倍精度削ればFP32のワットパフォーマンス向上するのは当たり前のこと
GK110のように専用の演算機を積む方法があっただろうけど面積あたりの性能が犠牲になるから微細化できなかったMaxwellでは出来なかったのだろう
HawaiiのようにシェーダユニットのサイクルあたりのFP64スループットを上げる方式だと面積あたりの性能は良いが、FP32の電力効率に大きく影響してしまう
- 825 :Socket774:2016/02/06(土) 09:48:06.63 ID:9l2kU5Bm.net
- nVIDIAが削ってるのはそれだけじゃないだろ
AMDに比べてどれだけ出来ることの少ない事か
それだけ特化すれば嫌でもワッパだけは良くなるよ
- 826 :Socket774:2016/02/06(土) 09:50:08.10 ID:bhC2/RiY.net
- アクセラレータがCPU並みに汎用である必要は全くないんだよw
それならCPU並べればいいんだし
非同期?VRでほとんど関係ないw
http://www.tomshardware.com/news/vrmark-virtual-reality-benchmark-preview,30820.html
- 827 :Socket774:2016/02/06(土) 09:53:29.01 ID:bhC2/RiY.net
- http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/?bpnet&d=1454641873634
CNN専用チップ、NVIDIAなどがGPUの改良で開発
http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/160204NVIDIAp0.jpg
Eyerissは、グラフィックス処理プロセッサー(GPU)と同様、SIMD(single instruction multiple data)などから成る
プロセッサー・エレメント(PE)を多数集積したICである。
作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。
- 828 :Socket774:2016/02/06(土) 10:09:30.98 ID:31cvCbc3.net
- >>823
はい
>>825
これKeplerとMaxwellの話だからAMD関係無い
逆にAMDは下手な鉄砲数撃ちゃ当たるであれもこれも入れすぎだと思う
グラボだけじゃなくて、ただでさえ戦力少ないのにいたずらに戦線拡大して
各戦線での戦力が更に薄くなって上手く行かない
- 829 :Socket774:2016/02/06(土) 10:22:11.50 ID:Zop5hU0g.net
- NVIDIAはここ最近で一番引きの強いディープラーニング分野では倍精度の重要度が低いから
プロセスやグラフィック性能との兼ね合いで需要に見合った製品展開してるだけのことだろ
AMDが倍精度押ししたいならNVIDIAがスパコン向け契約を獲得したVoltaに向けて
そっち方面を強化してるみたいに、ニーズを探して売り込めば良いじゃん
- 830 :Socket774:2016/02/06(土) 10:32:23.71 ID:vutPE+69.net
- Maxwell2で倍精度削って性能上げたのは、ハイエンドの980TiやTitanにだけ当て嵌まる
本来なら、ハイエンドにふさわしい倍精度専用のシェーダーをつぎ足すのを止めて、単精度シェーダーを増やしている
GK100は4.3Tの単精度シェーダーと1.4Tの倍精度シェーダーを別々に持っていた
GM200は7Tの単精度シェーダーだけ持っている
GM200が仮に倍精度性シェーダーも積んだ場合、想定されるのは5.5Tの単精度、1.5Tの倍精度というところだろう
単純に言うと、単精度性能はGM204より少し上にしかならず、倍精度性能はK40より少し上にしかならない
ちなみに、ラデの場合は単精度と倍精度両対応シェーダーだから、Furyが倍精度対応した場合でも性能は落ちない
総レス数 1002
241 KB
新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★