■ このスレッドは過去ログ倉庫に格納されています
【IT】GoogleがTensorFlowのためのTensor2Tensorを発表
- 1 :ノチラ ★:2017/09/02(土) 21:41:14.10 ID:CAP_USER.net
- TensorFlow(TF)コミュニティとGoogle Brainチームは、Tensor2Tensorを使用したTF APIの大幅な拡張を発表した。
Tensor2Tensor(T2T)は、TFで訓練され実行されているモデルのモジュール性と可搬性の課題に取り組んでいる。その取り組みでは、TFトレーニングに必要なコンポーネント用に標準化されたAPIを使用して、共通で使用されているディープ・ラーニング・モデルのパイプラインを拡張可能なオブジェクト・モデルに抽象化している。T2Tの目標の1つは、モデルトレーニングパイプラインとその環境を再現するコストを削減することである。もう1つは、TFの既存のAPIで行われる共通的な操作に必要なエンジニアリングの労力を回避することである。共通的な操作であっても、ユーザ同士で簡単に複製できない場合や、特定のアーキテクチャや問題でしか機能しない場合もある。
T2Tは、モデルアーキテクチャ、オプティマイザ、学習率減衰、スキーム、およびハイパーパラメータ向けに既存のTFライブラリで動作する。また、そのライブラリには、事前訓練モデルおよびサンプルデータセットが付属しており、TFによって使用されるモダリティを表している。コアTF Python API周辺のT2T抽象化は、データのシリアライゼーションや圧縮のようなTFパイプラインのコンポーネントについて保証するため、オブジェクトインターフェイスのレイヤを提供する。また、ハイパーパラメータやモダリティなどのためのモデル仕様のデフォルトと制御メソッドもある。これによって、ユーザは、TFパイプライン環境を調整することではなく、実験を繰り返したり、結果を比較したり交換したり、研究トピックに集中したりすることがより容易になると報告されている。
データセットはTFRecord protobufファイルで標準化されている。トレーニングデータセットは、Problemのユーザ定義のサブクラス、あるいはPythonデコレータと、クラスインスタンス化なしで直接関数呼び出しを使用するレジストリアプローチで生成できる。Problemは、訓練時間のハイパーパラメータ、それらの入力と出力のモダリティとデータセットで構成される。Problemメソッドは、エンコーダ、ファイルパス、入出力ターゲット、ハイパーパラメータ、デフォルトの属性値を処理する。モデル精度などのモデルメトリックもProblemにカプセル化されている。ハイパーパラメータセットは、レジストリデコレータを使用して登録されたHparamsオブジェクトである。
トレーニングの実行ファイルでは、設定可能な同期および非同期トレーニングが可能である。TF_CONFIG環境変数によって、gRPCとGPUのグループのサポートで、マスタおよびパラメータサーバホストを設定する。また、パラメータサーバごとにある複数のGPUなどによるグループ内にある、各サーバノード内の計算リソースで構成される論理クラスタリングを設定する。
https://www.infoq.com/jp/news/2017/09/tensor-2-tensor
- 2 :名刺は切らしておりまして:2017/09/02(土) 21:45:08.11 ID:8osrb+Uy.net
- 不思議な目の錯覚で、女性の腕がおかしいほど長く見える(画像)
http://zuddz.hatenablog.com/entry/article/2760.html
- 3 :名刺は切らしておりまして:2017/09/02(土) 22:04:25.79 ID:UdkWPCt9.net
- 機械学習はファイルの準備に手間がかかるからな
ある程度フォーマットを自動で整形してくれると助かる
- 4 :名刺は切らしておりまして:2017/09/02(土) 22:22:23.18 ID:XpIzbBtc.net
- トレーニングデータセットって、何種類あるの?
- 5 :名刺は切らしておりまして:2017/09/03(日) 01:11:08.74 ID:45Ta41Cs.net
- APIってpythonだけ?
- 6 :名刺は切らしておりまして:2017/09/03(日) 09:48:55.40 ID:bLeN439tp
- さっぱり分からん、勉強せんといかんな
- 7 :名刺は切らしておりまして:2017/09/03(日) 11:59:53.06 ID:V9D20V6V.net
- >>4
Tensor2Tensorにはサンプルデータないんじゃないの
TensorFlowのサイトを見ると、
まずはMNISTで手書き文字データを入手して試せと書いてある
https://www.tensorflow.org/get_started/
>>5
GitHubで公開されているソースはPythonだね
https://github.com/tensorflow/tensor2tensor
他の言語だったら、例えばJavaならJythonとか使えばいいんでない?
バージョンの相性の問題もあるかもしれないが
- 8 :名刺は切らしておりまして:2017/09/03(日) 12:29:05.37 ID:TE8R9ByC.net
- 久々に、オレには何のことやらサパーリな記事(^^;
- 9 :名刺は切らしておりまして:2017/09/03(日) 15:52:01.80 ID:E1Ogl16i.net
- こんなうんこみたいなスレにはスラドくらいでしかレスがつかないだろうなぁ。
板違いなんだよね。2chのルール的にはオッケーだとしても、ノチラさんの「うんこスレ製造機」の名誉称号獲得は避けられないよ。
- 10 :名刺は切らしておりまして:2017/09/03(日) 19:02:18.45 ID:7ZwUPc8n.net
- このスレが伸びないのが日本の暗澹たる未来を示してるよ
- 11 :名刺は切らしておりまして:2017/09/03(日) 19:11:11.10 ID:5S9nfDI1.net
- CHAINERがあるから
- 12 :名刺は切らしておりまして:2017/09/03(日) 20:24:31.75 ID:7ZwUPc8n.net
- Chainerは世界でまったく認知されてないやろ・・・
オープンAIに人送りこんだから、そこからどれだけ宣伝できるかやな
総レス数 12
5 KB
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★