『 統計技師への道 』

日々の学びを残すブログ

R

 読んだ&やってみた。

 ブルーバックスからR関連の本が出ていて気になっていたので購入。

cuiのコンソールではなく、補助ツールの『Rコマンダー』による統計解析法を紹介する内容でやや物足らない感じだった。昔、流体力学の実験を発表した際にRコマンダーでt検定やanovaをやっただけだったので、3次元散布図やqqプロット、影響プロット、ロジスティック回帰などごちゃごちゃ触れて面白い内容だった。まぁ、本当に『超』入門といった感じなので買わずに立ち読みだけでも良かったかも(-_-)。

 

 

 読んだ&やってみた。

データサイエンスのための統計学入門 ―予測、分類、統計モデリング、統計的機械学習とRプログラミング

データサイエンスのための統計学入門 ―予測、分類、統計モデリング、統計的機械学習とRプログラミング

 

githubを参照しながら読んだ。 

データサイエンス領域の統計学機械学習の基本的な内容をまとめた本。関連用語がまとめられていて数式なども少なくわかりやすかった。自分としては5章~7章までの『分類』、『統計的機械学習』、『教師なし学習』の基礎がしっかりと理解できたので良かった。

python3

最近、同業でもpython3やR、SQLを勉強してる人が出てきているみたいで、頑張ってみようと思い勉強を再開。一昨年、昨年と『Deep learningごっこ』をやってからやや遠ざかってしまっていたのでpython3を基礎からやり直しをした。前回インストールしたanacondaのver.から大分経っていたので、再度インストールし直してから始めた。

 

ここ1~2ヶ月ほど読んだ&やってみた本。

Pythonチュートリアル 第3版

Pythonチュートリアル 第3版

 

感想:pythonの取扱説明書。一通りの動作を確認しながら精読したが、後でネット上に転がってるのを発見。買う必要はなかった(リサーチ不足で無駄遣い)。>>>https://docs.python.jp/3/index.html

復習にはなった。

 

 

次。

退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

 

『ノンプロでもできる』とあったので手に取った。技術書500ページ越えは途中、心が折れそうになったが一通り挙動の確認はできた。こういった使い方をしたことがなかったので新鮮で仕事や趣味でいろいろ試してみたくなる一冊だった。

後半のExcelやWord、CSV、ウェブスクレイピングなどは応用できそうなものが多く載っており、言語に対しての視野が広がった気がした。

 

 

独学プログラマー Python言語の基本から仕事のやり方まで

独学プログラマー Python言語の基本から仕事のやり方まで

 

 少し気になってた本だったので本屋で立ち読みしてたら欲しくなって買った。

今までpythonの入門書ばかり漁っていて『コレでできるようになったのか?』『どこまでいったら理解したといえるのだろうか?』悶々としていた時に手に取ったので良いタイミングだった。技術書というよりは独学者に対しての方向性を示してくれるような内容でこれからどう知識&技術を広げて言ったら良いのかわかりやすくまとめてある感じで良書だった。

Bash使ってみたかったけど、その環境が必要になるイメージが全く湧かなかったので、導入せずネットで調べながら読み進めるといった感じで軽く流してしまったけど、プログラマの人達はみんな使ってる物なのだろうか?(周りにプロの人達いないので知りたい…。 ubuntuにも興味あるけど、壊れたとか言う報告もあるので…うぅぅ(-_-)。)

他に就職面接の対策的な内容であったり、さらに学ぶための参考書紹介など、プログラマ入門書といった内容で勉強になった。 

 

下記は正誤表。

読み物系と情報系。

 読んだ(もう古い感じの本)。

確率思考の戦略論  USJでも実証された数学マーケティングの力

確率思考の戦略論 USJでも実証された数学マーケティングの力

 

 

会社を変える分析の力 (講談社現代新書)

会社を変える分析の力 (講談社現代新書)

 

 良い環境が整っていたからできたことなのかなと思った。

単なる数字としてではなく統計資産として生かすことが今後の企業の戦略において重要だと感じられる内容で勉強にはなった。だが、未だ文系的社風が根強い日本企業の中でどれだけの企業が過去のデータを大切にしているのか。環境作りから周囲の理解まで、超えなければならない高い壁が多すぎる気がして、日本企業ではなかなか難しいねと思ってしまった(^_-)。

 

 

あとは情報処理の基礎を知りたいと思い資格教本の一気読み(借りた)。

 

かんたん合格 基本情報技術者教科書 平成30年度 かんたん合格シリーズ

かんたん合格 基本情報技術者教科書 平成30年度 かんたん合格シリーズ

 

 

 

 

基本情報技術者試験 対策テキスト 平成29-30年度版

基本情報技術者試験 対策テキスト 平成29-30年度版

 

 現時点で資格取得は目標としてないけど、新鮮で面白かった。

応用情報というのもあるようなのでそのうち似たようなシリーズを読むかも。

まぁ、範囲は網羅的で実務的ではない感じの内容だったので資格を取ったところで現場で使えるとは思わないが言葉の理解はできたと思う。

 

最近、医療関連の学会でもSQLやRを使ったデータ分析・データマイニングバイオインフォマティクスなど分析関連の講演が増えてきている気がする。たぶんAI(と呼ばれてる物)やゲノム医療、次世代医療基盤法などの影響で分野を超えた研鑽が必要となる。データ分析屋を生業としている『本物』にはなれないと思うが『本物に少しでも近い視点』に立ち、形にしていけたらと思う。

受験記録:統計検定 統計調査士

試験名:統計検定 統計調査士

 

結果:合格(自己採点:86 (たぶん)

 

前回の試験、『ビジネス統計スペシャリスト』の反省を生かし勉強を開始。午前の部(統計検定2級または専門統計調査士)も受けようと思っていたけどシフトの関係で夜勤明けになることと受験会場まで結構距離があったのでパスした(2級はCBTでもやっているようなのでそちらで考え中)。

まぁ、10月、11月は本業の学会やら研修会・セミナーが盛りだくさんだったので1科目に絞っておいて正解だった

 

 

勉強時間:30時間程度(10分、15分の隙間時間の活用で合計これくらい)

 

受験理由:『りてらしぃ』っぽいものがほしかった。 

 

 

使った教材:

統計検定 統計調査士対策コンテンツ 第3版 pdf

https://csi.rikkyo.ac.jp/social_research_resource/%E7%B5%B1%E8%A8%88%E8%AA%BF%E6%9F%BB%E5%A3%AB%EF%BC%88%E7%AC%AC3%E7%89%88).pdf

読んだ。分かりやすくまとめてあるので良い。

 

他に参考書として

社会調査法入門 (有斐閣ブックス)

社会調査法入門 (有斐閣ブックス)

 

 と

よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)

よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)

 

どちらも一読程度。

内容は東京大学出版の統計学シリーズでも十分な内容だったので参考程度にしかならなかった。丁寧で読みやすさではおすすめ。

 

それから公式の参考書(過去問)がこちら(大事(^_-)-☆)

日本統計学会公式認定 統計検定 統計調査士・専門統計調査士 公式問題集[2013〜2015年]

日本統計学会公式認定 統計検定 統計調査士・専門統計調査士 公式問題集[2013〜2015年]

 

 過去問を2回ほど解いてみたけど割と簡単で以下のような成績だった。

勉強開始時

2013年:  96.6 点

2014年:  86.0 点

2015年:  76.6 点

2016年:  76.6 点

 

 

試験2日前

2013年:  100 点

2014年:  96.6 点

2015年:  90.0 点

2016年:  86.6 点

 

 感想

2013年から2016年までの問題よりやや難易度が増している印象。『適切でないものを選べ問題』が減って純粋な問いが多くなっていた感じ。

1問目から面喰ってしまいラスパイレスにして減点。。。(-_-)後悔

来年は上級資格の『専門統計調査士』を受ける予定。もう少し勉強時間が作れたらいいのだけれど。他にも視野に入れているものもあるので来年は忙しくなりそうで楽しみ。

 

 

サンプルサイズが小さい場合の統計的検定の比較

最近、怪我をしてしまいブログ放置にしてた(-_-;)

ようやく調子が戻ってきたので再開する。

 

サンプルサイズが小さい場合の統計的検定の比較

コーパス言語学・外国語教育学への適用ー

http://www.mizumot.com/files/permutation.pdf

 

読んだ。

permutation testについて調べていたら見つけた論文(?)。

snp解析などでも使われており詳しく知りたかったので読んでみた。

読みやすく、超基本的なパラメトリック、ノンパラメトリックの説明やより正確なp値を求めるための検定法の比較検討が書かれて分かりやすい。

 

readingmonkey.blog45.fc2.com

あとこちらも読んだ、勉強になった(笑)

社会調査法入門 + 社会調査のウソ

下の2冊を古本屋で見つけたので購入、読んだ。

社会調査法入門 (有斐閣ブックス)

社会調査法入門 (有斐閣ブックス)

 

 前に読んでみようと思っていた本、というか教科書。

販促活動を一部担当していることもあり、アンケート用紙や調査票の設計などに役立ちそうだと思い購入。社会調査系の教科書をしっかり読んだの初めてかも。とても分かりやすくまとまっている。

前半は社会調査の要点を説明、後半は統計学的なデータ分析の手法の説明といった構成。14章(質的な研究について)は自分には関係なさそうだったので飛ばした。 

アンケートを回答することはあっても設計側に立ったことがなかったので、これほど練られているものだとは知らなかった。

第二部は調査データの分析方法についての紹介。ほとんど知ってる内容だったのでさらっと読んで読了。他の統計学の教科書より内容が軽い感じで読みやすかったかなという感想。

 

あとついでにこちらも。

「社会調査」のウソ―リサーチ・リテラシーのすすめ (文春新書)

「社会調査」のウソ―リサーチ・リテラシーのすすめ (文春新書)

 

 久しぶりに笑った。

書かれている内容は古いが社会調査はゴミなのだということがよくわかった。新聞、雑誌、テレビなどで加工されたデータを読み取る際は疑ってかかったほうが良いことがよくわかる。データを見る際の疑う目を持つことの大切さと『マスゴミ』という言葉は本当なんだなという感想。そして、著者の軽快な文章と『文句あるならかかってこいや』的な内容に終始笑いながら読んだ(いろいろ苦労したんだろうなぁ)。

 

2冊を一気読みして社会調査の表と裏を知ることのでき若干戸惑いのようなものを感じている(^_-)-☆

結果:ビジネス統計スペシャリスト

試験名:ビジネス統計スペシャリスト エクセル分析スペシャリスト

 

結果:合格 (900/1000)

 

勉強時間:対策としては4時間程度

 

使った本:基礎統計学Ⅰ 統計学入門

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)

 

 

受けようと思った理由:自分でもよくわからない。

 

難易度:易しい。ベイズ統計など出ないので統計検定3級以上、2級未満くらいだと思う。個人的には全然物足らない感じだったが、まぁ、一般的な実務レベルではちょうどよいのかもしれない(適当(^_-)-☆)

 

感想:

初めてパソコンを使ったテスト(CBT)を受けた。結果がすぐわかるところがいい!

難易度はやさしめだったが公式本が買えず、東大本(赤)とExcel2013で受験対策したために点数落とした感じ。前日に東大本(赤)を一通りパラパラ目を通しながら『計算問題がメイン』だと勝手に思い込み、文章問題が出てくると予想してなかった。エクセルでのデータ分析問題の操作は実務慣れしてるのですぐ処理が終わるけど文章問題はモニター小さくて字が読みづらくて本当にイラッ(^_-)-☆。それが交互に出題され、リズムが崩されるようで妙に疲れてしまった(-_-;)。

試験時間は60分だったけど20分ほどですべて解答できた。試験後に予定を入れていたこともあって見直しもせず終了ボタン、その場で合格通知が表示された。用事を済ませ帰宅途中、県内最大級の本屋さんで公式本を見つけたので立ち読みしたら『内容そのままやんけぇ!』って感じで鼻水が出た。

 

まぁ、気分転換として楽しめた1日だったかな(^_-)-☆

 

今回の教訓:

『出題内容をよく確認し、公式本を使ってバランスよく、無理のない勉強計画を。』