【国産AI】400億パラメータで日本語特化　情報通信研究機構、独自の生成AIを試作 [oops★]

oops ★

https://image.itmedia.co.jp/news/articles/2307/04/my_0704nict01.jpg
試作モデルの返答例。質問に対する回答ではなく、文章の続きを生成する

https://image.itmedia.co.jp/news/articles/2307/04/my_0704nict02.jpg
存在しない「本居宣長」に関する映画について、映画のあらすじや、その映画にまつわるプロモーション活動に関するテキストが創作されている例など

情報通信研究機構（NICT）が、日本語に特化した大規模言語モデルを試作した。Webから独自収集した350GBの日本語テキストをもとに開発したモデルで、400億のパラメータを持つという。

試作したモデルは、プロンプトを途中まで入力すると、大規模言語モデルが続きのテキストを生成する。ファインチューニング、強化学習などは実施しておらず、「性能面ではChatGPTなどと比較できるレベルではない」ものの、日本語でのやり取りが可能な水準には達したという。ただし、事実と異なる内容や意味をなさないテキストを生成することも確認しているとする。

また、現在「GPT-3」と同規模となる1790億パラメータを持つモデルの事前学習をスタート。学習用テキストの大規模化にも取り組んでいるという。さらに、民間企業、大学、国立研究所などとの共同研究を拡大し、安全に活用できる大規模言語モデルの研究開発に産学官連携して取り組む予定としている。

※以下省略。記事全文はソース元にて

2023年7月4日
https://www.itmedia.co.jp/news/spv/2307/04/news174.html

■国立研究開発法人情報通信研究機構プレスリリース
日本語に特化した大規模言語モデル（生成AI）を試作
～日本語のWebデータのみで学習した400億パラメータの生成系大規模言語モデルを開発～
https://www.nict.go.jp/press/2023/07/04-1.html

【国産AI】400億パラメータで日本語特化 情報通信研究機構、独自の生成AIを試作 [oops★]

【国産AI】400億パラメータで日本語特化　情報通信研究機構、独自の生成AIを試作 [oops★]