2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【統計学】統計好きでも意外と知らない「p<0.05」の本当の意味<p値ハッキング> [すらいむ★]

1 :すらいむ ★:2024/04/05(金) 20:51:57.11 ID:HURuvpJv.net
【統計学「p値」の謎】統計好きでも意外と知らない「p<0.05」の本当の意味<p値ハッキング>

● 「p値」を理解するための例え

 p値の概念は必ずしも直感的ではない。そこで、統計学者が大好きなたとえを使ってみよう。

 私はコインの入った袋を持っていて、「コインをめくるとすべて表が出る確率が高いだろう」と考えているとしよう。そして実際、コインを1枚取り出して5回めくるとすべて表が出た。これは何かおかしなことが起きているという、それなりに説得力のある証拠になるだろう。

 では次に、最初のコインで5回のうち表が出たのは3回だけで、2回は裏が出た場合を考えてみよう。これは、私の理論の証拠としてはよろしくない。

(以下略、続きはソースでご確認ください)

ダイヤモンド・オンライン 4/5(金) 6:02
https://news.yahoo.co.jp/articles/7442092ad751032353e8b757208c5ede930485f1

2 :名無しのひみつ:2024/04/05(金) 20:56:53.98 ID:4qxxHehM.net
字数稼ぎの薄くて回りくどい文章

3 :名無しのひみつ:2024/04/05(金) 21:06:48.65 ID:8xAjcT9G.net
意外と知らないどころか今時 p値ハッキングなにそれ?ってやつはヤバイだろ

4 :名無しのひみつ:2024/04/05(金) 21:08:51.31 ID:YJA+nDHA.net
「サンプルが増えれば「偶然」の確率も上がる」との見出しだけでヤバい記事なのがわかる。(確率は変わりません。発生回数が増えるだけです)

5 :名無しのひみつ:2024/04/05(金) 21:21:19.35 ID:LSC6lDei.net
P値ハッキングどころか、そもそもサンプルした標本データの確率分布を確認して仮定とするモデルと同じ正規分布に従っているかを確認しないといけない。そもそも正規分布に従っても無いのにP値で仮定が正しいか行うこと自体が無意味。確率分布を確認するにはサンプルとして取るデータは何万、何十万と必要だろう。せめて数千ぐらいは取りたいが、実際はこのようなことをしていない。サンプルデータが12個だけという最初から論文にならない論文も沢山見受けられる。にも関わらず査読ではねないのは、査読するものが統計処理を理解していないから。結論を言うと、次のパターンによる誤りだらけ。
1)論文執筆者自身が統計処理を理解していないので機械的にP値検定で結論づけてしまう誤り。物理と数学以外の理系の論文はこれが多いので、結論に全く信憑性がない。地球温暖化も怪しいとノーベル物理賞受賞学者が否定するのも当然。
2)サンプルデータそのものが少ない。20や50程度しか取れない。医学系や生物学系に多いパターン。当然結論は信頼できない。
3)論文執筆者が意図してp値ハッキングする。論外。結論は見る価値もない。

6 :名無しのひみつ:2024/04/05(金) 21:48:04.61 ID:m3GhNOeE.net
論文の数が10000あったらそのうちの500はP値が偶然5%以下になるがそれはいいのかな?

7 :名無しのひみつ:2024/04/05(金) 22:24:21.06 ID:4qxxHehM.net
>>6
だから(という訳では無いが)論文のメタ解析というのがある

8 :名無しのひみつ:2024/04/05(金) 23:18:15.75 ID:mgPwfd6W.net
>>1は、一昨年昨年に全国大学に量産された「データサイエンス担当教員」(ほぼ全員、文学研究者か、データサイエンスの講義は受けたことのないIT屋)に、ぜひ読ませたい記事だ
悶麩蚊顎症が唯一、文系私大で認めたデータサイエンスの重点大学のカリキュラムと講義内容と教員たちをよく知っているのだが、
>>1の内容どころか、Rを知らないどころか、excelのマクロを使えないため、
学生に解析させて無償で巨大企業に提供して大学が稼ぐデータを、すべて手作業で処理している
学生への教育が、数年すれば使えなくなる目先のテクニックだけなのはいうまでもないが、これが、
大学の経営者(資産家で大手企業の株主様)や、紋武火画苦笑の高級官僚(灯台学部の落ちこぼれの成れの果て)には大受けしているらしい
富裕層がどうなろうと折れの知ったことではないが、学生にマトモなデータサイエンス教育が施されるには、
データサイエンス担当教員つまり文学者や市井のIT屋が、>>1の記事を読んで、内省することが不可欠だとおもう

9 :名無しのひみつ:2024/04/06(土) 09:59:56.03 ID:TvgrVBof.net
科学板にダイヤモンドソースでスレ立てするなよ…

10 :名無しのひみつ:2024/04/06(土) 12:31:33.99 ID:VIqpT3IO.net
何が本当で何が偽物化があやふや院なる

全ての論文該当しそうなのですが・・・

今の科学も確率論で一番再現率の高いものを使用している
でも真実は再現できていないもありうるのですね

全員統合失調症の幻覚!とあるとなることも考慮する必要がある

11 :名無しのひみつ:2024/04/06(土) 12:49:42.72 ID:xlDMQBcj.net
 
p値
木兆

12 :名無しのひみつ:2024/04/06(土) 14:11:33.50 ID:CY8mZcOA.net
統計つかうなら知らない奴いないだろ

13 :名無しのひみつ:2024/04/06(土) 14:25:42.63 ID:s9p0JNoY.net
>>1
数式が無くてチンプンカンプンだ
戯言の領域を出ていない主張、記事

14 :名無しのひみつ:2024/04/06(土) 14:27:04.20 ID:9+Zem2hU.net
フィッシャーが一生のうち一回くらい間違えてもいいよね。ってくらいの発想だから

15 :名無しのひみつ:2024/04/06(土) 15:10:48.95 ID:94gUuz0Q.net
この手の「p値だけを見るのは危険」って言うやつってたいてい効果量まで言及しないよなぁ
雑魚ばっか

16 :名無しのひみつ:2024/04/06(土) 16:26:03.95 ID:Jw3ra2HB.net
世の中n=1とか因果関係と相関関係の区別できない奴とか
ゴロゴロしてるからp値とか早すぎる

17 :名無しのひみつ:2024/04/06(土) 18:41:51.30 ID:DsRueQlY.net
今の日本の理系としては
この記事をできるだけ多くの理系学生に読んでほしいと思うは
教員がこれを知らないというのが現在の日本の大学のデフォルトなので

18 :名無しのひみつ:2024/04/07(日) 00:41:06.45 ID:47zP5UEe.net
ノンパラ検定やればいいだけじゃね?

19 :名無しのひみつ:2024/04/07(日) 01:34:14.84 ID:QDmanLPw.net
事象Aが有であったときに事象Bであった
事象Aが有であるのに事象Bがなかった
事象Aが無であるのに事象Bであった
事象Aが無である時に事象Bもなかった

知らんけど

20 :名無しのひみつ:2024/04/07(日) 01:55:23.25 ID:uIZKU3Pp.net
ピーチク
ビーチク

21 :名無しのひみつ:2024/04/07(日) 09:40:25.67 ID:NjDB5D3B.net
最近はp値使ってる論文は受け付けませんってジャーナルもあるんでしょ

22 :名無しのひみつ:2024/04/07(日) 14:20:31.72 ID:q+15G9wl.net
3試合連続

23 :名無しのひみつ:2024/04/07(日) 21:15:20.45 ID:Jqdp1ufL.net
なぜ検定では5%水準とか1%水準を使うのか、それらの数字の根拠を述べよ。(5点)

24 :名無しのひみつ:2024/04/10(水) 20:00:39.66 ID:Prt5q7cr.net
なぜ配点が5点なのか

25 :名無しのひみつ:2024/04/10(水) 20:04:35.01 ID:Prt5q7cr.net
two one-sided testでも、許容できる誤差は自分で決める

総レス数 25
7 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★