『 統計技師への道 』

日々の学びを残すブログ

保健医療分野におけるAI活用推進懇談会pdf:(17/6/27)

ざっくり読んだ。

 

資料:保健医療分野におけるAI活用推進懇談会

http://www.mhlw.go.jp/file/05-Shingikai-10601000-Daijinkanboukouseikagakuka-Kouseikagakuka/0000169230.pdf

 

 昨年、AIの医療応用に対してとある会社の偉い人が『専門家(医療職)でもない人たちが作っていることが問題だ』的なことを言ってる記事を読んだことがある。

当時、『あぁ、こういう人が足を引っ張るのか~』と思ったことがあったが、関係なく突き進んでいるようでなにより(^_-)-☆

 

適当に読んだ感じだと使用する場面としてはやはり画像診断・ダブルチェックといったアシストが主。

以前興味があって載せたgoogleのがん組織のAIによる鑑別の記事を思い出したが、もうできていたりするのだろうか。(使えるレベルになった場合、病理医は解剖、臓器・組織の切り出しと診断に、検査技師は標本作成までの工程をただひたすら専念という形になるのか…さらなる省力化&薄給化にはなりそう)。

上述pdfのなかには他に『バイオインフォマティシャン育成』や『保健医療関係者がデータサイエンティストとしてAIの開発に携われるよう、デ ータサイエンティストの育成プログラムを策定する』など記載されてる。今後は現場の人間もシステムの長所・短所を知るためにも統計学やプログラミングは必要になってくるだろうな。

 

ま、来るときに備え武器は揃えておかないとね(^_-)-☆

 

あと、門外漢のど素人目線で疑問が2つ。

1つ目は責任の所在。見落としちゃった・間違っちゃった的なことになった場合。システム作った業者も責任とってくれるのかな? 

2つ目は『規格』的なもの。あっちの病院のAIは優れているけどこっちの病院のAIはダメとか差があっては意味がない。全施設で完璧で安定した結果を出すにはISOやら腕時計のクロノメーター規格みたいなものも必要になってくるのかな? 

いろいろメンドクサソウ等々、なんとなく思った。

買って後悔:ヤバくてダメでまる裸 etc.

読み物系を一気に消化しようとまとめ読み。

さすがに疲れた。なんというかどれもこれもアレな感じ。

 

ヤバい統計学

ヤバい統計学

  • 作者: カイザー・ファング,Kaiser Fung,矢羽野薫
  • 出版社/メーカー: CCCメディアハウス
  • 発売日: 2011/02/19
  • メディア: 単行本
  • 購入: 11人 クリック: 93回
  • この商品を含むブログ (23件) を見る
 

 『データ・サイエンティストに学ぶ分析力』系のお話物。同じく微妙(^_-)-☆。

 

ダメな統計学: 悲惨なほど完全なる手引書

ダメな統計学: 悲惨なほど完全なる手引書

 

題名を『ダメな和訳書』にでも変えたほうが良い。

一昔前の翻訳ソフトに丸投げしたような文章だったので3~4割は飛ばし読み。

感想として最近の神経科学・心理学・医学論文の問題点を思い出した程度。(^_-)-☆

 

統計学をまる裸にする データはもう怖くない

統計学をまる裸にする データはもう怖くない

 

この中では一番読める。表紙がセクシーなだけ(^_-)-☆

 

 他に

p値とは何か 統計を少しずつ理解する34章

p値とは何か 統計を少しずつ理解する34章

 

 和訳がう〇こ(^_-)-☆

 

統計学の和訳の本はなかなかしんどいなという感想。

岩波データサイエンス vol.6

読んだ。

岩波データサイエンス Vol.6

岩波データサイエンス Vol.6

 

 このシリーズ最後の巻らしい。実践的で面白いシリーズだったので残念。

 

Rコードのある記事は読み流す程度で後で写経予定。 

 

今回の特集は『時系列解析』。状態空間モデル、状態空間モデルのマーケティングへの応用、VARモデルによる因果関係推論。小特集は『シミュレーションとデータサイエンス』として天気予報やタンパク質のシミュレーション・多変量解析、天文学シムシティ、夢と脳と機械学習と「てんこ盛り」な内容。

(書いていて自分が何を読んだのかわからなくなってくる。。。)

 

読んでいて興味を持ったのが『状態空間モデルのマーケティングへの応用』。

数年前、販促プロジェクトに参加した際、統計解析と販促ツールの開発を担当し、予測・推定のモデルづくりを試みたことがあった。ど素人だったので様々な資料を読みあさりながら、意識し始めたものがまさに『時点』だった。

営業サイドから求められるものは『数撃ちゃ当たる』的なものではなく、『確実に射落とせ』的なものだったので需要サイドのより深い理解のためと、顧客を獲得した際に極限まで人員削減された状況下でこなすためには内外それぞれに対しての動的な構造理解が必要だったというのが本音。その時期にこの本が出ていれば最短で要点をつかめ活かせたかもと思った。(その後、がむしゃらに頑張ってある程度形にしたとたん、いわゆる『アレオレ詐欺』っぽいことに巻き込まれ、いろいろな知らない人たちが参加。ぐちゃぐちゃにかき回されて、別の人の総取りって形で終幕)

 

あと、最近読んだバイオインフォつながりで『揺らぐタンパク質と老いる私』。

タンパク質のゆらぎ、ミスフォールディング、分子動力学シミュレーションの分析例などを説明・紹介。文中にある参考文献は目を通しておきたい。(結局シリーズ全巻そろいそう)また、データ分析とは関係ないが文章の中にあった「老いていく私たちの体は(猫のゆりかご)の水のようなものなのかもしれない」という表現が印象に残っている。(多少かじったことのある身としては沁みる表現だったので)

 

他に気になったのは内容より参考文献の佐藤・樋口『ビッグデータ時代のマーケティング』。探していたけど題名忘れていた本。いずれポチると思う。

ビッグデータ時代のマーケティング―ベイジアンモデリングの活用 (KS理工学専門書)

ビッグデータ時代のマーケティング―ベイジアンモデリングの活用 (KS理工学専門書)

 

 

 

あぁ、特集で「強化学習」出してほしかったなぁ(´;ω;`)

バイオインフォマティクス入門 + 医学統計の基礎のキソ(2冊)

読んだ(熟読)。

バイオインフォマティクス入門

バイオインフォマティクス入門

 

数日前に本屋で見つけて立ち読みした程度だったが気になったので購入&読了。

 

じっくり読むと(初版本だったためか)誤植が多くて『ムカッ☆!』っとした。

薄いページ数だったが読了までに思ったより時間がかかってしまった。内容が濃いねッって感想。生命科学関連や計算科学は浅く感じる内容だったが、構造解析や配列解析に関しては知らないことも多く新鮮で勉強になった。

機械学習や多重検定についてはさらに詳しく知りたいので『MLPシリーズ 生命情報処理における機械学習』も読んでみようか考え中。

 

 

こちらも読んだ。

 と

論文や文献あさりをしていて見つけた本。

統計学の『使い方』というよりは『読み方』のための入門書(教科書でなく雑誌感覚かも)といった感じ。全3巻シリーズのようだが2巻が見つからず1巻と3巻のみ(^_-)-☆

 

内容は1巻は統計アレルギー克服を目的にP値や信頼区間について簡単なもの。

3巻は研究の質を評価する方法という副題でサンプル数が適切か『有意差あり・なし』の解釈、統計学のごまかしを見破る方法など論文書き手側にはちょっと怖い本かもといった感想。数式もほとんど出ないので『完全独習 統計学入門』や『マンガでわかる統計学』に近い内容で自分にとってはあまり血肉にならないレベルだった。

 

基礎の復習としていいと思う。

まぁ、2巻は見つけても時間ないのでたぶん読まないと思う(^_-)-☆

バイオサイエンスの統計学 + 医療関連

読んだ。(そしてこれからも読む)

バイオサイエンスの統計学―正しく活用するための実践理論

バイオサイエンスの統計学―正しく活用するための実践理論

職場の書棚にずっとあったもの。(新品同様だった(-_-))
とても良い本。検定ごと説明に図を多用し、症例を多く載せているためイメージしやすい。
論文の読解や作成時にそばに置いておくと良いかも。ただ高い本(そして重い本)なので個人では買わないと思う(買えない)。



記事
かくしてプログラミングは生物学者の必修科目となった。
wired.jp
読んだ。
ちょうどPythonをググってて見つけた。
やはりプログラミングはスキルとして必要だと感じた。
ただ追求するあまり『視野狭窄』にならない程度のスキルとして身に着けておきたいと思う。


鉄欠乏性貧血に迫る。
scienceportal.jst.go.jp
読んだ。
まぁ、なんとなく知ってる内容でわかりやすかったので。



論文など
学会資料
【発作性夜間ヘモグロビン尿症(PNH)診療の最前線】
【遺伝子変異からみた骨髄増殖性腫瘍】
【骨髄異形成症候群の遺伝学的基盤について】
【アンチトロンビンレジスタンス:新しい遺伝性血栓性素因】
血友病治療の進歩と展望】
知人から借りて読んだ。最新の血液疾患の研究内容。
そろそろ、『WHO2016分類』の訳書が出てきそうなので期待してる。



雑誌
次世代データ解析:ビッグデータ解析を視野に入れて
【臨床検査領域におけるビッグデータの活用と課題】
【健康医療データを用いた大規模データマイニングに向けて】
【臨床検査領域におけるビッグデータの意味とその活用に必要な統計学視点】
【医療・健康分野で求められるデータベース構築と効率的検索システム】
【DPCなどの医療ビッグデータ分析の現状と課題】
職場の書棚にあった。
医療ビッグデータの活用についての紹介。臨床検査に関連する『うす~く、ざっくり』といった内容。たぶん、ビッグデータという『バズワード』の流行りの影響を受けたために書かれた特集だったんだろうと思う。
そもそも、医療は【サイエンス】+【統計学】の世界なので奇跡(偶然)を極力取っ払った分野。『奇跡的な回復』なんてものはないだろうし、健康診断の結果表にある基準範囲なども今までのデータの蓄積からなるもの。いまさら何を?といった感じだった。

ちょっと休憩:雑学本(17/06/10)

本日は散歩のついでに『とある会』に参加。

黒酢やらニンニクの成分やら相変わらずのマニアックな研究内容が多くて面白かった。 

以前と比べて統計解析を見ても苦にならない程度まで読み取れるようになってきた(気がする)ので創薬や基礎研究の話の中で出てくるRCT、メタアナリシスは割と楽しめた。

 

 

そのあと、会場から程近い県内最大級の本屋へ買い物。

 医学系。

誰も教えてくれなかった 血算の読み方・考え方

誰も教えてくれなかった 血算の読み方・考え方

 

 たまに、立ち読みしてたけど「やっぱりいい」と思い購入。

 

スタンダード フローサイトメトリー 第2版

スタンダード フローサイトメトリー 第2版

  • 作者: 池本敏行,伊藤秀明,井野礼子,小賀厚徳,小川惠津子,川合陽子,河本圭司,小池由佳子,近藤智子,菅原ゆうこ,?野邦彦,林田雅彦,日野和義,松村耕治,結城啓介,日本サイトメトリー技術者認定協議会,野村昌作,村上知之,米山彰子,東克巳
  • 出版社/メーカー: 医歯薬出版
  • 発売日: 2017/06/06
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る
 

 第1版を持っていたけど表紙が破れたりしていてボロボロなので購入。

内容は以前のものよりカラーで内容増えて見やすくなった。

 上記2冊はたまに確認したくなった時に重宝しそう。

 

 

生物情報学系。

データサイエンス的思考法やR操作の勉強に使えそうだったので。

 

 

その近くに『バイオインフォマティクス事典』があったが出版年の2006年以降改定など行われていないようで古く感じたので下を購入。事典代わりに使いたい。

バイオインフォマティクス

バイオインフォマティクス

 

 

 

マーケティング・データサイエンス系。

ビジネス活用事例で学ぶ データサイエンス入門

ビジネス活用事例で学ぶ データサイエンス入門

 

仕事でデータサイエンティストをされてる方のブログを見て好評だったので買ってみた。内容をチラ見したけど技術書ではなく割と軽めの読み物(?)的な感じがしてる。

血肉になれば良いけど、試しに練習も兼ねサンプル事例をR、python3でやってみる。

基礎Python + ゼロから作るDeep Learning + bioinfo

読んだ&やってみた。

基礎Python 基礎シリーズ

基礎Python 基礎シリーズ

 

 python3を基礎から理解しようと購入。

 

本書に沿ってatomエディタを入れてみたが使い勝手がよく気に入った。

リストやタプルといった固有のデータ操作、制御、関数などをわかりやすいサンプルコードで説明してくれている。入門書としては最良だと思う。

 Rも勉強途中だがpythonとのメリット・デメリット比較記事をネット上で読んでも実感できるほど深く理解・実践できてないので精進したい。

(仕事では一切使わないので遠い道程だが…)

最後まで読んで著者がミュージシャンということに驚愕した…多彩な人もいるものだ。

 

続けて、

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

 

 読んだ&やってみた。

先日MLPの深層学習を読んだのでその流れで。

上述のpythonの復習も兼ねた形になり理解もしやすかった。

やってみると割とシンプルなものだと感じた。

ただ、自分はSEでもなければPGでもないので最初、githubが何なのかわからず途中まで全部写経してた(タイピングは苦ではなかったが、大幅に時間ロス…)。

 

pythonの基礎から始まり、パーセプトロンニューラルネットワークの基礎・学習、誤差逆伝播法、学習に関するテクニック、畳み込みニューラルネットワークディープラーニング、といった流れでライブラリやフレームワークなどのツールに頼らず理解するという面白い内容だった。特に学習に関するテクニック(momentum、AdaGrad、adamなど)はわかりやすい説明で勉強になった。

生業としてる人達からしたら『なんちゃって深層学習』なのかもしれないがが素人・凡人の自分には十分楽しめる書物だった。

 

 

さらにもう一冊。

バイオインフォマティクス入門

バイオインフォマティクス入門

 

 読んだ(立ち読み&流し読み程度)。

血液学の本を探していた時たまたま発見。jsbiの公式本らしい。買ってない。

 

 読んでて思ったことはバイオインフォとデータサイエンスはよく似ている

統計学、計算科学、データベーススキル、プログラミングスキル、機械学習データマイニングなどは重なる領域。

異なるのは分子生物学計量経済学くらいか(素人目線です)。

両分野ともに「人材不足が~」とか言われているみたいだけど、探せば割と使える人材いるんじゃないだろうか?

 

 本書はバイオインフォマティクス技術者認定試験というものの教本らしい。

時間があったら受けてみたい。