『 統計技師への道 』

日々の学びを残すブログ

サンプルサイズが小さい場合の統計的検定の比較

最近、怪我をしてしまいブログ放置にしてた(-_-;)

ようやく調子が戻ってきたので再開する。

 

サンプルサイズが小さい場合の統計的検定の比較

コーパス言語学・外国語教育学への適用ー

http://www.mizumot.com/files/permutation.pdf

 

読んだ。

permutation testについて調べていたら見つけた論文(?)。

snp解析などでも使われており詳しく知りたかったので読んでみた。

読みやすく、超基本的なパラメトリック、ノンパラメトリックの説明やより正確なp値を求めるための検定法の比較検討が書かれて分かりやすい。

 

readingmonkey.blog45.fc2.com

あとこちらも読んだ、勉強になった(笑)

社会調査法入門 + 社会調査のウソ

下の2冊を古本屋で見つけたので購入、読んだ。

社会調査法入門 (有斐閣ブックス)

社会調査法入門 (有斐閣ブックス)

 

 前に読んでみようと思っていた本、というか教科書。

販促活動を一部担当していることもあり、アンケート用紙や調査票の設計などに役立ちそうだと思い購入。社会調査系の教科書をしっかり読んだの初めてかも。とても分かりやすくまとまっている。

前半は社会調査の要点を説明、後半は統計学的なデータ分析の手法の説明といった構成。14章(質的な研究について)は自分には関係なさそうだったので飛ばした。 

アンケートを回答することはあっても設計側に立ったことがなかったので、これほど練られているものだとは知らなかった。

第二部は調査データの分析方法についての紹介。ほとんど知ってる内容だったのでさらっと読んで読了。他の統計学の教科書より内容が軽い感じで読みやすかったかなという感想。

 

あとついでにこちらも。

「社会調査」のウソ―リサーチ・リテラシーのすすめ (文春新書)

「社会調査」のウソ―リサーチ・リテラシーのすすめ (文春新書)

 

 久しぶりに笑った。

書かれている内容は古いが社会調査はゴミなのだということがよくわかった。新聞、雑誌、テレビなどで加工されたデータを読み取る際は疑ってかかったほうが良いことがよくわかる。データを見る際の疑う目を持つことの大切さと『マスゴミ』という言葉は本当なんだなという感想。そして、著者の軽快な文章と『文句あるならかかってこいや』的な内容に終始笑いながら読んだ(いろいろ苦労したんだろうなぁ)。

 

2冊を一気読みして社会調査の表と裏を知ることのでき若干戸惑いのようなものを感じている(^_-)-☆

結果:ビジネス統計スペシャリスト

試験名:ビジネス統計スペシャリスト エクセル分析スペシャリスト

 

結果:合格 (900/1000)

 

勉強時間:対策としては4時間程度

 

使った本:基礎統計学Ⅰ 統計学入門

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)

 

 

受けようと思った理由:自分でもよくわからない。

 

難易度:易しい。ベイズ統計など出ないので統計検定3級以上、2級未満くらいだと思う。個人的には全然物足らない感じだったが、まぁ、一般的な実務レベルではちょうどよいのかもしれない(適当(^_-)-☆)

 

感想:

初めてパソコンを使ったテスト(CBT)を受けた。結果がすぐわかるところがいい!

難易度はやさしめだったが公式本が買えず、東大本(赤)とExcel2013で受験対策したために点数落とした感じ。前日に東大本(赤)を一通りパラパラ目を通しながら『計算問題がメイン』だと勝手に思い込み、文章問題が出てくると予想してなかった。エクセルでのデータ分析問題の操作は実務慣れしてるのですぐ処理が終わるけど文章問題はモニター小さくて字が読みづらくて本当にイラッ(^_-)-☆。それが交互に出題され、リズムが崩されるようで妙に疲れてしまった(-_-;)。

試験時間は60分だったけど20分ほどですべて解答できた。試験後に予定を入れていたこともあって見直しもせず終了ボタン、その場で合格通知が表示された。用事を済ませ帰宅途中、県内最大級の本屋さんで公式本を見つけたので立ち読みしたら『内容そのままやんけぇ!』って感じで鼻水が出た。

 

まぁ、気分転換として楽しめた1日だったかな(^_-)-☆

 

今回の教訓:

『出題内容をよく確認し、公式本を使ってバランスよく、無理のない勉強計画を。』

受験申込:ビジネス統計スペシャリスト

プレゼン&顧客対応終了、ようやく解放されてこれで自分時間が作れる。

 

数日前、発表用pptと台本作成が終わりネットでたまたま見つけた『エクセル分析スペシャリスト』を詳細調べず勢いだけで受験申込。。。開放感と過労気味で判断力が完全に『無』だった。統計の資格とかあるのかな~と検索かけて引っかかったものでついやってしまった。

stat.odyssey-com.co.jp

 

統計検定も興味があったけど冷静になり考え中。というかサイトに過去問が載ってたので1級の内容みたら『お?』と『は?』と『ん?』の連続でボコボコになりいっきに冷静になれた(-_-;)。

ガチで時間作らないとこれはこれは・・・って感じ。東大赤本だけではきつそう。

やるなら2級くらいからかな、いや自分のような初学者はは3・4級でも…(自信喪失中)

www.toukei-kentei.jp

 

 

そして2日後試験なのに何もしてない。

サイトで紹介されてる下記の本があるか近所の本屋に探しにいってみたけどなかったので対策本なしで受ける予定。まぁ、東大本(赤)+ excel 2013 でどうにかなるかな?

ビジネス統計 統計基礎とエクセル分析 (ビジネス統計スペシャリスト・エクセル分析スペシャリスト対応)

ビジネス統計 統計基礎とエクセル分析 (ビジネス統計スペシャリスト・エクセル分析スペシャリスト対応)

  • 作者: 後藤正幸,辻本将晴,玄場公規
  • 出版社/メーカー: オデッセイコミュニケーションズ
  • 発売日: 2015/05/25
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る
 

データ・スマート エクセルではじめるデータサイエンス入門

最近、大口顧客の訪問のための資料作成やら本部・経営層の訪問の準備やらアクシデント対応やら学術発表依頼やらやらやらやら・・・で勉強&読書時間がない(-_-;)

休日が急に取れたので買い出しついでに本屋へ。

 

立ち読み程度。

データ・スマート Excelではじめるデータサイエンス入門

データ・スマート Excelではじめるデータサイエンス入門

 

 たしか原本出たの数年前だったような(-_-;)遅い

ビジネスマンがサカサマの表紙が特徴的だったので記憶してる。

2~3年前にモンテカルロシミュレーションをエクセルVBAで組んで遊んでいた時、何か調べていたらたまたまヒットしたような?(過程は忘れた)

 

立ち読み程度だが内容はエクセルを使ったクラスター分析、教師あり・なし学習、線形プログラミング、予測モデリングなど一般的手法を例題を使って習得していくようなもの。最後は『エクセルよりRがいいよ~』的な流れでRの処理が紹介されていてたのが(笑)

 

あと最近読んだものは論文5本ぐらいか。

内容は臨床研究&消化管出血関連。

やや過大評価気味な内容のものがあり、メーカー側もあまり積極的には出したくないようだったのでそっ閉じな感じで発表依頼自体がうやむやになりそうな流れ(^_-)-☆徒労感

未来の年表

 読んだ。

日本はお先真っ暗だよ~と不安を煽る本。(一応、統計関連かな?)

 

内容は前半は人口減少の日本でおこると考えられることを年表形式に説明。

部分的に(?)と思うところがあったので調べてみたらややリサーチ不足な感じがした。火葬場が不足するとか輸血血液が不足だとかAIが~とかいろいろアレな感じ。

後半は著者の考える処方箋という名の提案集。『20世紀成功体験との訣別』や外国人労働者やAIへの過度な期待への指摘は同感かな。

あとはなんだかあまりウケないだろうなという感想。

まぁ、『因習まみれの国、日本』で改革的なものができるとは思わないけど。

 

読み終えてから見つけた似たような記事。

www.newsweekjapan.jp

日本のこれまでの発展は人口依存型の『日本人の、日本人による、日本人のための生産&消費』から生じたもの。

自分の周りでも『根性論』や『勘違いの栄光』を語る老人ばかりで本当にう〇こ(^_-)-☆

データ解析のための統計モデリング入門:一般化線形モデル・階層ベイズモデル・MCMC

読んだ&やってみた。

しっかりと土台形成してから取り組みたいと思って後に回していた本。

ようやく時間が作れたので読みながら手を動かしてみたが、すごく丁寧な作りで評判通りの内容だった(^_-)-☆。コードは少なくGLM・GLMM・階層ベイズモデル・MCMCを俯瞰的に楽しめる内容で図解が多いため理解しやすい。著者の講義を受けているような感じがした。各章末に文献紹介もされていて今後の勉強・参考書あさりに役に立ちそう。(本はすでにメモ&ポストイットまみれ)

いくらか図に誤りがあるようだが既にwebサイトで修正されていたので参考になる。

とある雑誌にはみどり本は中級レベルとあったけどなかなかこの『中級』レベルの本というのが少ないように感じるので貴重な本だと思う。

 本書の流れで初めてwinbugsによるMCMCをやってみたけどwinbugsはもう開発もしていない(?)みたいなのでやや古いのかもしれない。今後、岩波DS vol.1にあったstanをかじってみようかと思う。

 

P値やモデル選択についての注意・解釈についてもわかりやすく説明されていたのでメモしておく。どこかでも似た記述があったのでしっかりと理解しておきたい。

『5章:GLMの尤度比検定と検定の非対称性』より

AICによるモデル選択では『良い予測をするモデル』を選ぶという目的を持ち、『予測の良さとは平均対数尤度』と明示したうえで、平均対数尤度を最大対数尤度とパラメータ数から推定する。尤度比検定などネイマンピアソンの枠組みの下での統計学的検定の目的は、帰無仮説の安全な棄却である。帰無仮説棄却のあとに残された対立仮説がどのような意味で『良い』モデルなのかは明確ではない。P値は効果の大きさそのものを表すものではない。推定された統計モデルの解釈は、それぞれの研究ごとに固有なものであり、分野ごとに異なる自然現象のとらえ方に依存しているのでその文脈の中で検討すべき問題。

 

 

岩波データサイエンス Vol.1

岩波データサイエンス Vol.1

 

昔、岩波データサイエンスvol1を読んでいたこともあり、とても理解しやすかった。

見たようなグラフがあったので読み返してみたら『あぁ、これか』と今さら気づいたこともあったりともう少し早めに取り掛かっておきたかった(-_-;)。

(Vol1読み返してみて『MCMC=モテて困るモテて困る 』かぁ、懐かしい)

 

そして、読み終わった後でこんな記事を見つけた。

https://www.nature.com/news/big-names-in-statistics-want-to-shake-up-much-maligned-p-value-1.22375