2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【IT】マイクロソフトの音声認識システム、「人と同等」レベルに到達

1 :ノチラ ★:2017/09/01(金) 17:55:20.97 ID:CAP_USER.net
Microsoftの研究員が開発した音声認識システムが、人間の速記者と同レベルとされる単語誤り率を達成した。

 Microsoftは米国時間8月21日、同社の音声認識システムが、プロの速記者に匹敵するとされる5.1%の単語誤り率に達したと発表した。

Microsoftは2016年、5.9%の単語誤り率で「ヒューマンパリティ(人間と同程度)」に到達したと考えたが、IBMの研究員らは、そこまでのレベルに達したとするには、IBMの最高記録である5.5%をやや上回る5.1%に達する必要があると主張した。

 IBMが実施した速記者に関する研究では、数人に会話を何回か聞いてもらい、もっとも優秀な速記者の結果が選ばれた。

 Microsoftのシステムは、2016年のテストと同様に、データセット「Switchboard」コーパスを使って測定された。Switchboardコーパスは、見知らぬ者同士が電話越しに米国英語で交わした約2400の双方向の会話から成るデータセットだ。このテストは、スポーツから政治までさまざまなテーマについて交わされた会話を文字化するものだ。

 MicrosoftのテクニカルフェローであるXuedong Huang氏は、次のように述べている。「音響モデリングを改善するため、CNN-BLSTM(Convolutional Neural Network combined with Bidirectional Long-Short-Term Memory:畳み込みニューラルネットワークと双方向長短期記憶の組み合わせ)モデルを追加した。また、複数の音響モデルに基づく予測を組み合わせるアプローチを、フレーム/セノンレベルと単語レベルの両方で取り入れた」

 「さらに、会話セッションの全履歴を使って、会話の次の流れを予測させた。これによって、音声認識システムの言語モデルが強化され、会話のテーマやその場の文脈に有効に適応できるようになった」

 重要な節目を迎えたものの、Microsoftは、さまざまな訛りや話し方を認識するのが機械にはまだ難しく、騒がしい環境ではパフォーマンスが良くないと認めている。

 Microsoftは、文脈を検知して会話をこれまでより正確に文字化するようモデルをトレーニングすることに成功したが、会話の意味を実際に理解するようコンピュータをトレーニングできるまでには、長い道のりがある。
https://japan.cnet.com/article/35106247/

2 :名刺は切らしておりまして:2017/09/01(金) 18:00:32.15 ID:9HmeOqlv.net
日本語も認識出来るの?

3 :名刺は切らしておりまして:2017/09/01(金) 18:01:12.68 ID:R4yVnaaq.net
人を超えてるgoogleより下ってこと?

4 :名刺は切らしておりまして:2017/09/01(金) 18:01:50.10 ID:s8QiJjNr.net
しかしこれだけではワープロの入力には使えない。
音声入力での間違いを訂正するのはひどく面倒だ。

編集機能を含めて音声入力を洗練させる必要がある。

5 :名刺は切らしておりまして:2017/09/01(金) 18:08:16.32 ID:YpRGMoEZ.net
でも安倍ちゃんの国会答弁を
聞き取るのは苦手

6 :名刺は切らしておりまして:2017/09/01(金) 18:09:52.16 ID:KPyfs695.net
>>5
中身ないから翻訳する必要がない

7 :名刺は切らしておりまして:2017/09/01(金) 18:12:10.75 ID:L65qAacb.net
コルタナさんは?

8 :名刺は切らしておりまして:2017/09/01(金) 18:13:20.30 ID:R/s8gzUi.net
>>6
中身があると閣議決定
中身(議事録)については破棄したので証明する必要はないとのこと

9 :名刺は切らしておりまして:2017/09/01(金) 18:15:37.88 ID:N4g0wLJD.net
リアルタイム?

10 :名刺は切らしておりまして:2017/09/01(金) 18:16:11.53 ID:cb0y4Bgx.net
1文解析するのに10分かかります

11 :名刺は切らしておりまして:2017/09/01(金) 18:16:33.78 ID:zQIOR/n8.net
>>7 10年もすればスマホ・PCの音声認識も>>1のレベルになるんだろうな

12 :名刺は切らしておりまして:2017/09/01(金) 18:20:50.40 ID:m5YRtznE.net
「でんでん」は「云々」と表記されるんだろうか。

13 :名刺は切らしておりまして:2017/09/01(金) 18:23:03.20 ID:z9612238.net
他の与野党もそうだが・・・。
なぜ、このような出鱈目がまかり通るのか・・・。


https://pbs.twimg.com/media/CaGkrTEVIAAmEiZ.jpg

14 :名刺は切らしておりまして:2017/09/01(金) 18:31:31.08 ID:SPZe4Eq7.net
喋んのが面倒だわ
音声認識とか全部オフだ

15 :名刺は切らしておりまして:2017/09/01(金) 18:44:12.15 ID:s8QiJjNr.net
「今日は曇りのち晴れです」
という文章を音声入力でする一例。
{
今日は晴れてます・・いや違った、今日は曇り後晴れです・・いや、この"後"は平仮名で書いたほうが判りやすいかな・・
}
面倒だ。

16 :名刺は切らしておりまして:2017/09/01(金) 18:54:05.40 ID:fyV4cYdm.net
2ちゃんって新しい物についていけないジジイババアばかりだなw

17 :名刺は切らしておりまして:2017/09/01(金) 18:55:01.26 ID:6yDERbrP.net
そのうちセンサー駆使して言いたいことも勝手に言ってくれたりして

18 :名刺は切らしておりまして:2017/09/01(金) 19:00:38.39 ID:s8QiJjNr.net
>>16
新しいものなら何でも受け入れるアホとは違う。
吟味、批判するのは発展向上のためにも必要なこと。

19 :名刺は切らしておりまして:2017/09/01(金) 19:01:28.55 ID:eOqMrji7.net
音が分かっても、意味は分からない。
意味が分からなければ、本当に正しい単語は選べない。

20 :名刺は切らしておりまして:2017/09/01(金) 19:07:20.05 ID:HJV9os8n.net
認識するけど聞く耳を持たないんだろ

21 :名刺は切らしておりまして:2017/09/01(金) 19:08:34.52 ID:ptObU8pW.net
ラリルレ阿倍のしゃべりは無理だね。

22 :名刺は切らしておりまして:2017/09/01(金) 19:14:36.08 ID:pG5O7Vwn.net
>>15
今日は曇りのち晴れです
スマホのgoogle音声認識では上記の通りだよ。

23 :名刺は切らしておりまして:2017/09/01(金) 19:14:44.58 ID:h4oWFMH/.net
 
 
中の人、大変だな
 

24 :名刺は切らしておりまして:2017/09/01(金) 19:21:09.14 ID:RxDJ+pS0.net
人並みじゃ一度じゃ認識されないな

25 :名刺は切らしておりまして:2017/09/01(金) 19:24:40.49 ID:s8QiJjNr.net
>>22
>>15を読めてないんじゃない?

26 :名刺は切らしておりまして:2017/09/01(金) 19:24:56.94 ID:NfWBivww.net
どうせ日本語はOCRのように難易度が跳ね上がる

27 :名刺は切らしておりまして:2017/09/01(金) 19:25:29.53 ID:FhZGqCuu.net
>>22
そういう話じゃないだろw

28 :名刺は切らしておりまして:2017/09/01(金) 19:27:20.16 ID:tneHcEAu.net
プロ速記者と比べてるけど妥当なの?レベル低くない?

29 :名刺は切らしておりまして:2017/09/01(金) 19:31:54.48 ID:p0lNhCYO.net
俺「Hey,Siri. 京都の天気は?」
Siri 「今日から9月ですね」

30 :名刺は切らしておりまして:2017/09/01(金) 19:42:21.09 ID:7PrYH/h1.net
日本人よりは遥かに英語リスニング能力高いだろうな

31 :名刺は切らしておりまして:2017/09/01(金) 20:02:04.48 ID:ArgYs/bz.net
なお、日本語には対応しませんwwww

これがマイクロソフトだ
日本人の敵
ソニーに期待
ソニーならやってくれるはず

32 :名刺は切らしておりまして:2017/09/01(金) 20:05:01.62 ID:l2X8HciJ.net
ガヤガヤ会話から議事録を書いてくれるまで頑張れ

33 :名刺は切らしておりまして:2017/09/01(金) 20:19:52.01 ID:B7Oxn91a.net
日本語は無理でしょ

総レス数 85
46 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★