2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【IT】統計学と機械学習を支える数学が、 「全く一緒」と言えるわけ

1 :ノチラ ★:2017/12/23(土) 20:36:54.90 ID:CAP_USER.net
中略
「ITと統計学の素晴らしき結婚」で生み出されたもの
では、高校までの数学教育はどのようにすればよいのでしょうか?

私の個人的な考え方は「統計学と機械学習の専門的な勉強がはじめられることをゴールとして、高校までの数学のカリキュラムは再編成されるべきである」というものです。

統計学に加えてここで突然機械学習の話が登場したことに驚いた方もいらっしゃるかもしれません。「統計学と機械学習」あるいは「統計学と人工知能」と言われると、多くの人がなんだか全く別のもののように感じるはずです。しかし、実はその背景にある数学的な道具立ては「全く一緒」と言っても過言ではありません。

初代『統計学が最強の学問である』では、この20年ほどで統計学がとんでもなくパワフルになった理由として「ITと統計学の素晴らしき結婚」という表現をしました。多くの人が大学の教養課程で習う「紙とペンの統計学」が、コンピューターサイエンスという強力な伴侶を得たことにより、現実的な問題の意思決定に際して大きな力を持つようになったわけです。しかし、この結婚によって生まれたのは「現代的な統計学」だけではありません。もう1つ「現代的な人工知能」というとてもパワフルな兄弟をも産み落としました。

1950年代にはじめて「人工知能」という言葉が使われるようになってからの第一次人工知能ブーム、そして1980年代の第二次ブームのそれぞれで、人工知能研究の主流は「コンピューターに人間の持つ論理や知識を教え込むことで知能を生み出せるのではないか?」という考え方でした。当時のこうした考え方に基づき書かれた人工知能研究の論文や書籍を見てみると、そのほとんどは記号論理学のような話ばかりが記述されており、統計学とは全く別の分野であると言えます。ただし、こうした「人間がコンピューターに論理と知識を教え込む」というやり方は行き詰まりを見せ、これら二度の人工知能ブームは廃ってどちらも冬の時代を迎えました。

一方で少なくとも1960年代の終わり頃からちらほらと、一部の人工知能の研究者たちは「確率」や「データへのあてはまり」といった統計学の概念を取り入れはじめます。たとえばディープラーニングは専門的には「層の数がとても多い(ディープな)ニューラルネットワーク」であると表現されますが、実は世界に先がけて多層ニューラルネットワークによる画像認識を研究した日本の甘利俊一は、ニューラルネットワークに統計学のような確率や微分といった考え方を持ち込みました。こうした「データとデータの間の最もあてはまりのよい数学的な関係性を推定する」という統計学的な考え方は、現代のディープラーニングの中でも大きく役に立っています。

話をまとめると、「ITと統計学の素晴らしき結婚」によって次の2つがこの世に生み出されたということです。

1つは統計学において、紙とペンの手計算だけでは難しい分析がコンピューターによる計算アルゴリズムで実現できるようになりました。これが「現代的なITによる統計学」です。一方で、コンピューターサイエンスの世界で生まれた人工知能研究においても、記号論理学のような理屈や知識表現だけではうまくいかなかったことが、統計学の理論と計算方法によって実現できるようになりました。このようなクロスオーバーが、現代のデータ社会の中でとても大きな力を発揮しているのです。そしてそれゆえに、統計解析手法と機械学習手法を数学的に記述するやり方は、細かい慣例などの違いこそあれ「基本的に全く同じ」というわけです。違いがあるとすれば数学的な理屈の後の、「どういうアルゴリズムでコンピューターを働かせるか」という部分ぐらいでしょうか。

そうすると、いまエンジニアたちが統計学と機械学習の背後にある数学に慣れておくことは、前述のような品質の向上や、生産計画の最適化に使うという以上の意味を持ちます。蒸気やガソリンを使ったエンジンを使いこなすために熱力学を理解するとか、電子部品を使いこなすために電磁気学を理解する、といったのと同じようなレベルで、これからのものづくりにおいてその競争力の少なからぬ割合が、機械学習技術をどう活かすか、というところと関係してくるからです。
http://diamond.jp/articles/-/153736

316 :名刺は切らしておりまして:2018/01/03(水) 14:35:45.96 ID:ZvrjA7dj.net
https://www.diamond.co.jp/book/assets_c/2013/01/02221-4-thumb-208xauto-22932.jpg

317 :名刺は切らしておりまして:2018/01/03(水) 14:55:16.60 ID:EzfWxr2N.net
統計学が機械学習を支えてるんだろ

318 :名刺は切らしておりまして:2018/01/03(水) 15:07:54.95 ID:FGF9q5sI.net
>>316

東京大学医学部健康科学科卒で医師免許を持っていないのに医学部卒の作者さんが
書いた本ですね!

319 :名刺は切らしておりまして:2018/01/03(水) 16:34:43.57 ID:XiyaVefS.net
https://www.diamond.co.jp/book/assets_c/2014/10/02823-0-thumb-104xauto-25045.jpg
https://www.diamond.co.jp/book/assets_c/2016/09/10076-9-thumb-91xauto-27701.jpg
https://www.diamond.co.jp/book/assets_c/2017/12/10451-4-thumb-91xauto-29427.jpg

320 :名刺は切らしておりまして:2018/01/03(水) 22:50:14.12 ID:DLvLFflh.net
昨今の機械学習界隈では、いわゆる
「統計屋」
がほとんど活躍していない。

裏にあるのは統計学なんだけど、機械学習には
そこまで高級な統計理論は必要ないから。
機械学習を仕切っているのはひたすら
コンピュータを学んできた、しかも若い人たちで、
歳を取った「統計屋」さんは見てるだけ。
これが実情。

だから、
「機械学習と統計は同じ」
なんて自己主張もしてみたくなるのさ

321 :名刺は切らしておりまして:2018/01/03(水) 23:07:25.15 ID:XqFHJziM.net
>>320
高級な統計理論って何?例えば

322 :名刺は切らしておりまして:2018/01/03(水) 23:20:26.47 ID:po5VacYb.net
それより聞きたいんだがExcelにpythonが実装されることを考えるとこれからの時代はRよりpythonなのか?教えてエロい人!

323 :名刺は切らしておりまして:2018/01/03(水) 23:24:10.53 ID:po5VacYb.net
なお趣味で勉強してるだけ。

324 :名刺は切らしておりまして:2018/01/04(木) 00:02:07.08 ID:yM2bCsHU.net
>>321
子供は知らなくていいんだよ。

325 :名刺は切らしておりまして:2018/01/04(木) 01:58:16.91 ID:KHFdpGNk.net
>>322
どう考えてもRよりpythonだろう。
ただし、素人が使うならどっちでも同じだから気にしなくていいよ

326 :名刺は切らしておりまして:2018/01/05(金) 09:31:48.07 ID:EkBrhwTi.net
AICよりBIC

327 :名刺は切らしておりまして:2018/01/05(金) 13:36:58.67 ID:oeC40w+m.net
メジャーで通用する日本の野球選手がピッチャーばかりな理由がわかった。
モンゴル力士みたいに八百長を在日韓国人が日本でやってるからだわ。

ピッチャーは、敵チームのバッター9人のうち3人だけ八百長してくれても残りの6人が
手を抜いてくれなかったら試合には勝てない。だから本当に実力が無いと成績が上がらない。

バッターは、敵のピッチャーが甘い球を投げてくれたりあらかじめ球種を合図で教えてくれたら
打つことができる。つまりバッターの成績は八百長でいくらでも粉飾できるわけだ。

日本人のピッチャーは大変だわ。味方チームのショートとセカンドが在日チョンだったら
投げるボールのサインを盗まれて在日韓国人バッターに合図を送られちゃうもんな。

しかも観客席にもいくらでも在日チョンが紛れ込んでるし。これじゃ投げる球種が
バッターにバレてても三振取れるぐらいの「本物の」怪物ピッチャーじゃないと勝てない。

在日朝鮮系の選手、特に野手に限ってやたらメジャー移籍に否定的だったり、
メジャーで通用する野手が日本に全くいない理由はこれだったんだなあ。

野茂がメジャーに行く時も朝鮮人の野球選手がめちゃくちゃ嫌がらせしてたやん。
朝鮮人が日本でインチキ八百長やってるのがバレるのが怖かったってオチだったと。

328 :名刺は切らしておりまして:2018/01/05(金) 21:44:35.21 ID:1+UNFW9V.net
>>322-323
学習環境が整ってるR

329 :名刺は切らしておりまして:2018/01/06(土) 12:04:37.90 ID:YLfqFlZL.net
と言うより、Excelで間に合うならひたすらExcelでがんばれるけどな。

330 :名刺は切らしておりまして:2018/01/06(土) 17:22:10.85 ID:xjAKEPVh.net
>>322
エクセルのVBAがpythonになるってことなの?

331 :名刺は切らしておりまして:2018/01/07(日) 01:43:52.35 ID:8dqMzj8r.net
まだ構想段階じゃねーかよ。
下手に統合しても使いにくいだけだと思うけどな。

Excelをそもそも使い続けるのかということの方が心配すべきだなwww

332 :名刺は切らしておりまして:2018/01/07(日) 09:51:01.57 ID:wn5AehNW.net
Excelの牙城が揺らぐことは今のところあり得ないと思うがの

333 :名刺は切らしておりまして:2018/01/08(月) 21:39:12.00 ID:J+EIkEAN.net
確率論の哀しいところは それが完全に正しいと証明された後ですら
誰も信用しないというところなんだよね

334 :名刺は切らしておりまして:2018/01/09(火) 15:47:15.40 ID:WiTw2D2B.net
証明されてないだろ

正規分布、F、t、χ^2 分布に従うとしたら〜みたいな未証明の仮定に依拠してるだけ

335 :名刺は切らしておりまして:2018/01/09(火) 20:26:01.34 ID:0RAa0/yZ.net
コーシー分布を見て、美しいと踊りだす。
そんなやつに、機械学習は任せられない。

336 :名刺は切らしておりまして:2018/01/10(水) 16:08:28.45 ID:UwouUCvG.net
そもそもあっちで使う数学と、こっちで使う数学が異なるルール、公理を持ってたら、それはもう数学じゃ無い。

まぁ日本では数学と算数という2種類のものがあるけどな。

337 :名刺は切らしておりまして:2018/01/10(水) 17:08:24.66 ID:L2GASEbf.net
>>336
それは違うんじゃね?
例えば、ユークリッド幾何と非ユークリッド幾何では、平行に関する公理が違うわけで

338 :名刺は切らしておりまして:2018/01/10(水) 17:40:30.84 ID:H/6K/b7g.net
>>337
ユークリッド幾何学は非ユークリッド幾何学の一部だ。
数学は非ユークリッド幾何学を含む概念だから、同じものだよ。

339 :名刺は切らしておりまして:2018/01/10(水) 18:11:00.82 ID:L2GASEbf.net
>>338
一部っつーか、ユークリッドでは公理が増えるでしょ

340 :名刺は切らしておりまして:2018/01/10(水) 21:48:32.96 ID:v8l+vyra.net
増えるよ
ゆーっくりっとね

341 :名刺は切らしておりまして:2018/01/10(水) 22:55:37.51 ID:h7Q0+GQf.net
>>322
そんなん実装されるのか?

342 :名刺は切らしておりまして:2018/01/14(日) 15:03:28.63 ID:T8K0ZGl9.net
>>341
1ヶ月くらい前にMSが発表した

343 :名刺は切らしておりまして:2018/01/14(日) 15:05:39.15 ID:8ntZduGp.net
>>337
特殊(ユークリッド)と一般(非ユークリッド)だな

>>339
えっ

344 :名刺は切らしておりまして:2018/01/14(日) 15:08:36.80 ID:Z8S5sEAu.net
>>7
なるほど

>>9
なんでニューラルネットワークにはフィードバック回路入れたらだめなんだろね

345 :名刺は切らしておりまして:2018/01/14(日) 17:03:32.51 ID:kT/7DZXS.net
>>344
入れるのもあるでしょ

346 :名刺は切らしておりまして:2018/01/14(日) 20:31:07.03 ID:9tikQ5jX.net
統計学者「統計学は、実は機械学習と一緒なんです(キリッ)」

347 :名刺は切らしておりまして:2018/01/15(月) 13:32:02.54 ID:rXjIOlAc.net
test

348 :名刺は切らしておりまして:2018/01/15(月) 15:53:54.43 ID:xrFN8HK2.net
若者の数学離れω

349 :名刺は切らしておりまして:2018/01/16(火) 16:39:06.58 ID:IEI4LQsU.net
>>166
宇宙をAIωに観察させたら相対性理論や量子力学よりも
人間には到底理解出来ない有効な理論を導き出してくれるかも知れない

350 :名刺は切らしておりまして:2018/01/17(水) 01:12:28.97 ID:4Rh4Bd1T.net
人間には到底理解出来なかったら、解明されてないのとまったく同じだろwww

351 :名刺は切らしておりまして:2018/01/17(水) 19:18:21.71 ID:lxFKhoSn.net
>>30
キショ

352 :名刺は切らしておりまして:2018/01/18(木) 21:24:32.10 ID:mMREcPJ1.net
統計学とか言ったら、あの著者の顔のイメージが思い浮かんできて、うんうん

353 :名刺は切らしておりまして:2018/01/19(金) 13:47:18.61 ID:f2QNglNN.net
>>177
(超)平面で分けてるのか?
曲面だと思ってた

354 :名刺は切らしておりまして:2018/01/19(金) 14:08:29.44 ID:tSkfkDx5.net
>>240
地震予知学者
次の6回以内に6が出る確率は15%以上

355 :名刺は切らしておりまして:2018/01/19(金) 14:32:18.71 ID:bZMhZMyo.net
>>353
一つのニューロンは超平面なんじゃね?
で、複数のニューロンによる結果を合わせることで、曲面的なものにしている
入力ベクトルと重み付けベクトルとで内積をとるって、そういうことだと思うよ

356 :名刺は切らしておりまして:2018/01/19(金) 15:00:50.87 ID:FYf1Bb3/.net
>>349-350
理論は無いけどなぜか答えだけ合ってるみたいな
得体の知れない物がAIとかDLなんじゃね

357 :名刺は切らしておりまして:2018/01/20(土) 09:41:19.13 ID:rT3HrQ8x.net
QOE

358 :名刺は切らしておりまして:2018/01/23(火) 13:04:59.90 ID:0bfERyeX.net
NHK杯での羽生君の活躍が見たい
これからが楽しみ

359 :名刺は切らしておりまして:2018/01/24(水) 16:23:24.25 ID:EsvMAOcJ.net
織田信成よりも、藤井九段。

360 :名刺は切らしておりまして:2018/01/25(木) 03:40:04.56 ID:pAt7+h+6.net
ロンダでも出世できるってほんとですか?

361 :名刺は切らしておりまして:2018/01/27(土) 03:02:41.68 ID:shzn+VDL.net
ビットコインに「投資」しているとか言い出す低能

大卒でそういうやつって半島にいるんだな。

362 :名刺は切らしておりまして:2018/01/27(土) 03:03:44.36 ID:shzn+VDL.net
✕ 半島にいるんだな。
○ 本当にいるんだな。

363 :名刺は切らしておりまして:2018/01/27(土) 08:20:39.76 ID:bvh9CY9p.net
>>361
半島乙

364 :名刺は切らしておりまして:2018/01/27(土) 12:54:13.93 ID:TC/onLF4.net
>>362
つい本音を書いてしまった??w

365 :名刺は切らしておりまして:2018/01/28(日) 13:15:47.24 ID:lo/95f5r.net
だとすれば、機械学習はいづれクオンタムになるということか

総レス数 365
107 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★