医療×AIセミナーシリーズ第8回「医療者がゼロから学ぶ、AI・データサイエンス超入門」

  • 日程:
    2019年09月05日(木)
  • 時間:
    18:00-20:00
  • 会場:
    東京大学本郷キャンパス 国際学術総合研究棟4F SMBCアカデミアホール
    地図
  • 対象:

    医師ら医療従事者、開発者、政策関与者、医療機器関係者など

  • 定員:

    50(定員に達し次第受付を終了します)

  • 言語:

    日本語

  • 主催:

    東京大学未来ビジョン研究センター、慶應義塾大学メディカルAIセンター、エムスリー株式会社m3.com編集部

  • 協力:

    日本ディープラーニング協会(JDLA)、世界経済フォーラム第四次産業革命日本センター(C4IRJ)

定員に達したため申込みを締め切りました。
概要

医療×AIセミナーシリーズ第8回「医療者がゼロから学ぶ、AI・データサイエンス超入門」
医療現場での課題解決に向け様々なテクノロジーが導入される中、AIやITの臨床現場での実装も進みつつあります。現場での課題を熟知する医師による開発や実装、医師と協働する開発者ら、社会実装に向けた仕組みをつくる政策関与者も増えてきました。

本セミナーシリーズは、こうした医師や開発者、政策関与者らが、それぞれの経験や知見を基に、開発・臨床現場で役立つ情報を共有し、関係者同士の交流をはかることで、医療現場での新しいテクノロジーの実装を進めていくことを目的として行います。東京大学未来ビジョン研究センター、慶應義塾大学AIメディカルセンター、エムスリー株式会社m3.com編集部が主催し、科研費「ビッグデータに基づいた医用人工知能の実装に向けた多面的検討」の研究の一環として実施します。

第8回は、臨床現場の課題解決に向けて、ゼロからAIやデータサイエンスを身に着け、画像診断支援AIの開発や医療データ解析を行っている湘南記念病院乳がんセンター副センター長の井上謙一氏と株式会社データックCEOで医師の二宮英樹氏をお迎えし、そのご経験をもとに医師など医療者がゼロから学ぶAIやデータサイエンスについてお伺いします。

  • 18:00-18:05
    オープニング
  • 18:05-18:35
    講演:二宮英樹氏(株式会社データックCEO、医師)
  • 18:35-19:05
    講演:井上謙一氏(湘南記念病院乳がんセンター副センター長)
  • 19:05-19:55
    質疑応答・ディスカッション
  • 19:55-20:00
    クロージング
講師プロフィール

井上謙一(いのうえ・けんいち)
湘南記念病院乳がんセンター副センター長
1999年旭川医科大学卒業、北海道大学第1外科に入局、消化器外科医として北海道各地で地域医療に従事。2009年北海道大学大学院医学研究科高次診断治療学専攻博士課程修了、癌研有明病院乳腺外科シニアレジデントとして研修、11年から現職。日本外科学会専門医、日本乳癌学会専門医。人工知能を用いた乳腺画像の解析の研究で、日本乳癌検診学会2017年度ピンクリボン賞、第12回「乳癌の臨床」賞優秀賞、第26回日本乳癌学会学術総会のExcellent Presentation Awardを受賞。
過去のインタビュー記事:『[深層学習でマンモグラフィーを自動読影―湘南記念病院乳がんセンター副センター長の井上謙一氏に聞く(1)](https://medicalai.m3.com/news/180718-interview-inoue)』『[マンモ自動読影、日本は後れを取る―湘南記念病院乳がんセンター副センター長の井上謙一氏に聞く(2)](https://medicalai.m3.com/news/180723-interview-inoue)』

二宮英樹(にのみや・ひでき)
株式会社データックCEO、医師
2013年東京大学医学部医学科卒業。脳神経外科、株式会社メドレーを経て、株式会社トライディアでデータサイエンティストとして、企業向けデータ解析・AI開発に従事。慶應義塾大学医療政策・管理学教室 博士課程でビッグデータ解析や病院のデータベース構築を行う。
過去のインタビュー記事:『[脊椎外科向けの問診アプリを開発したわけ―慶應義塾大学医療政策・管理学教室 医師でデータサイエンティストの二宮英樹氏に聞く(1)](https://medicalai.m3.com/news/180731-interview-ninomiya)』『[医療関係者とエンジニアをつなぐ場をつくる―慶應義塾大学医療政策・管理学教室 医師でデータサイエンティストの二宮英樹氏に聞く(2)](https://medicalai.m3.com/news/180803-interview-ninomiya)』

ディスカッサント

江間有沙(えま・ありさ)
東京大学未来ビジョン研究センター特任講師/国立研究開発法人理化学研究所革新知能統合研究センター客員研究員
2012年東京大学大学院総合文化研究科博士課程修了。博士(学術)。京都大学白眉センター特定助教、東京大学教養学部附属教養教育高度化機構、同大学政策ビジョン研究センターを経て現職。日本ディープラーニング協会理事/公共政策委員会委員長、人工知能学会倫理委員会副委員長。人工知能の倫理やガバナンスについてを研究テーマとしている。著書に『AI社会の歩き方-人工知能とどう付き合うか』(化学同人)など。専門は科学技術社会論(STS)。

藤田卓仙(ふじた・たかのり)
世界経済フォーラム第四次産業革命日本センター ヘルスケア・データ政策プロジェクト長
2006年、東京大学医学部卒業。慶應義塾大学メディカルAIセンター、慶應義塾大学イノベーション推進本部とも兼任。医療政策学、医事法学、医療経済学、医療情報学の観点から、学際的な研究を行う。健康医療情報のプラットフォーム化と情報の利活用、大学医学部における産学官連携、地域包括ケアシステム・在宅医療における法政策、医療事故と専門職の責任、ヘルスケアにおける広告表示規制、医療等個人情報保護法制、医学領域における知的財産権などを研究テーマとしている。

東京大学未来ビジョン研究センター、慶應義塾大学メディカルAIセンター、エムスリー株式会社m3.com編集部は2019年9月5日に医療×AIセミナーシリーズ第8回「医療者がゼロから学ぶ、AI・データサイエンス超入門」を開催し、講師に二宮英樹氏(株式会社データック代表)、井上謙一氏(湘南記念病院乳がんセンター副センター長)をお迎えし、自身でゼロからAI(人工知能)のイロハについて習得し、臨床現場への応用にこぎつけた、学習方法や苦労したことなどについて語った。
 

 

データで個別化医療を可能に

最初に登壇したのは株式会社データック代表の二宮英樹氏。二宮氏は東京大学医学部を卒業後、脳外科医として勤務していた時に、「治療しても助からない患者が多くいるが、適切な情報を届けられれば状況を変えられるのでは」と感じたという。その後、二宮氏はオンライン診療などを手掛ける株式会社メドレーに入社し、医療辞典の企画・執筆などやオンライン診療を担当する中で、データを活用した医療の標準化をやりたいと考えるようになった。別のベンチャーでデータサイエンスを学び、昨年8月にデータックを設立した。

データックは主に、4つの事業を展開している。1つめが脊椎外科に特化した問診アプリ。2つめが電子カルテに入力された内容から重要な用語などを抽出する医療言語処理技術の開発で、その他に睡眠ログを解析するアルゴリズムの開発や臨床研究関連事業を手掛けている。

このうち、問診アプリでは患者の腰痛に関して、痛みの程度やどれくらい歩けるかなどのデータを取得する。そもそも、アプリでこうしたデータを取得しようと考えたのは、データの質がとても大事だと痛感したからだという。二宮氏は「医療分野ではいざ、解析・活用しようとしても、使えない内容や質のデータが多い」と話す。

データックのアプリでは患者が治療を評価するPRO(Patient reported Outcome)を取得している。現在、医療分野の中でも画像やゲノム、血液検査などに関するデータは豊富にあるものの、PROのように患者の症状やQOL(Quality Of Life)に関するデータは世界を見回してもほとんど蓄積されていない。二宮氏は「こうしたデータを集めればおもしろいと思った。一方で、こうしたデータを収集するのはコストや手間がかかり、すごく大変。現場に役に立つものを作りたいと考えた」と話す。

このアプリを通じて取得したデータを見てみると、同じ疾患でも患者によって感じ方は大きく異なるという。例えば、腰痛が影響する項目を見てみると、睡眠や立つこと、社会生活だけでなく、性生活に関わることを上げる人もいる。このうち、性生活に関わることは対面診療では患者から聞き取るのが難しい。二宮氏は「問診アプリを利用することで、患者が何に困っているのかを把握して、治療に生かしたい。患者ごとに適した個別化医療の実現を目指している」と話す。

さらに、腰痛は患者の精神面への影響も指摘されている。二宮氏は今後について「心理的な指標を問診でとることで、それをみながらカウンセラーを紹介するなど、治療のスクリーニングにも使える。さらに今後は術後の満足度予測をしてみようと考えている」と言う。

組織内でAI人材の育成を


2つ目の柱である医療言語処理事業では、自然言語処理の技術を用い、薬に関する相談に対応するチャットボットや、医師が書いた文章の中から症状や臨床病名(レセプト病名ではない)、薬剤名を抽出するエンジンなどを開発している。本エンジンはTXP Medical株式会社から全国の救命救急センターに展開されている「Next Stage ER」にも組み込まれている。「Next Stage ER」では、リアルタイムの構造化データ提示によりユーザーにフィードバックをかけることにより、診療時のカルテ入力と同時に高精度な臨床情報レジストリ構築を実現することが可能である。多忙な臨床現場において研究データを収集する難しさを克服する一つのアプローチと言える。

こうした事業とは別に、二宮氏が自身のミッションとして掲げているのが、データ解析をする人材の育成だ。自社内だけでなく、製薬会社にも育成プログラムを提供している。データックはデータの解析を請け負うこともあるが、二宮氏は「製薬企業の中にデータ解析事業部やAI事業部ができて、業界内の事情などを一番わかっているその人たちと一緒にデータ解析をするのが一番効率的だ」と育成事業の狙いを話す。

現在、データックが製薬会社に提供しているAI人材の育成プランは、メディカル・アフェアーズ部門の社員を対象としている。二宮氏は「メディカル・アフェアーズの人がAIについて学ぶことで、企画やマネジメントだけでなく、データ解析をする外部の人とのやりとりをより効果的にできるようになるだろう」と話す。

そのAIは社会にとって必要か?


医療分野では予防や早期発見、診断、治療、といった各段階に加え、ゲノムや創薬、業務効率化といった幅広い分野でAIの活用が期待されている。実際、米FDA(食品医薬局)や欧州のCEマークでは多くの医療機器が承認されているのに対し、日本は出遅れている。ただ、こうした現状に対し、二宮氏は各国の医療制度や社会構造の違いなどを考慮すべきだと指摘する。

例えば、米国では2019年に自閉症の診断・治療アプリCognoa(コグノア)がFDAに承認された。米国では2012年ごろから同社の取り組みに関する記事が話題に登っていたのに対し、日本は医療AIサービス開発や研究のスタート自体が遅い。一方で医療は国によって制度や診療報酬体系が異なるため、ある国で承認される医療AIを、日本にそのまま展開できるとは限らない。二宮氏は「アメリカでは診断が4歳以降となるのが一般的であるのに対し、日本では3歳児健診で実施される。医療ITにしても医療AIにしても、新しい技術によって提供される価値が、既に社会で充足されているかどうかという点は重要になる」と指摘する。

同様に、糖尿病患者に対し、食事や運動の状況に合わせて最適なインシュリンの投与量を提案する米国のアプリについても、「HP上で1型糖尿病患者は数カ月に1度しか医療機関を受診できない患者が多いと記載されているが、一方で日本では医師へアクセスがいい。制度的な違いは大きい」と話す。

課題定義がデータ解析のすべて


とは言え、AIにおいて日本が出遅れているのは確かだろう。こうした現状を踏まえ、二宮氏は「医療分野にデータの現場感がある人が増えてほしい」と話す。医療従事者からはよく、PROの信頼性について問われるというが、これに対し「今使っているデータは信頼できるのか?と逆に聞きたい。例えば血圧は24時間で変化するが、一回測定しただけのデータに意味はあるのか。機械や胎動でノイズが出る可能性もある。レセプトの病名も正しいとは限らない」と疑問を投げかける。「データをどう見るかが大事。学問が積み重なった医学という分野で医療とAIの両方を分かる人がデータを活用する必要がある」という。

とは言え、データ解析に明るくない医療従事者は何から手をつければいいのか。二宮氏は自身が実践した学習方法についても披露した。それによると、まずはテックアカデミーやユーデミーなどのオンライン講座でPythonについて知識を身に着けたという。その際には「専門のエンジニアにはかなわない。技術の進化が早すぎてついていくのが難しいと感じた」と話す。

二宮氏は「教材はたくさんある。機械学習やディープラーニングを動かすことはすぐできるようになる」とする一方で、「現実のデータは汚いし、想定と違うことしかない。実践を通じて学ぶことが大事」と話す。

さらに、「医師にとって、データ解析の能力は必ずしも必要ではない。それよりも、社会にどうバリューを生み出していくか。『イシュー度』つまり、課題の質を考えるほうが大事。課題定義がすべてだ」と指摘した。

 

 
続いて登壇したのは湘南記念病院乳がんセンター副センター長である井上謙一氏。「普通の乳腺外科医だった」と自身を評するが、井上氏もまたAIが現在ほど普及する前に独自に技術を身に付け、データを解析してきた第一人者だ。

18世紀の蒸気機関、20世紀の電気による大量生産など、これまでの産業革命と並び、AIは第四次産業革命と言われる。今までの産業革命を凌駕するインパクトを社会に与えるという見方まであるが、これは医療においても同じ。井上氏は「影響度の大きさはワクチンや麻酔、抗生物質、DNAの発見に匹敵するだろう」と指摘する。

乳腺外科医として勤務していた井上氏がAIに興味を持ったのは、米グーグルが人工知能を使って人の顔を判別したというニュースがきっかけだった。「人の顔がわかるなら、医療でも応用できるのでは。AIで乳がんを判別しよう」と思いついたという。

現在、乳がん検診はマンモグラフィが柱となっている。定期的な受診によって早期発見し、死亡率を引き下げることが期待されている。早期発見のためには高い精度の読影技術が求められるが、こちらは精度管理中央機構が管理している。井上氏は「AIで読影できるようになったら、読影医の仕事が楽になるだけでなく、費用も減らせる。しかも、AIはどんどん賢くなる」と話す。

勉強開始3カ月で論文


AIについて理解を深めるため、井上氏は2016年から2カ月間、まずは本を読み漁ったという。それによって基本的な知識を身に付けた上で、2017年1月にはGPUを購入し、自身でパソコンを組み立てて、解析のための環境を構築した。2017年2月からは試行錯誤しながらプログラムを組んで、翌月には論文の投稿にこぎつけている。井上氏は「(Linux、AI、Pythonという基本についても知識がない)三重苦の私でも3カ月で論文を出せるくらい技術をモノにできた。もちろん、データは必要だが、得意な分野で挑戦すれば他の多くの人にもできる」と振り返る。

具体的にはどのようにAIのアルゴリズムを構築したのか。まずはマンモグラフィの画像を用意した。その画像データを、腫瘤、石灰化、構築の乱れ、局所性非対称性陰影(FAD)という4つの所見について、それぞれ悪性、良性に分類していく。

ところが、マンモグラフィの画像は高解像なため容量が大きく、解析するにはパソコンのメモリがいくらあっても足りない。そこで画像加工のフリーソフトをダウンロードし、マンモグラフィの画像の中から、解析に必要な病変部分だけを手作業で切り取って保存していった。井上氏は「とても地味な作業だった。AIの研究はデータ整備が8割だ」と話す。

こうして4つの所見がある合計1901枚の病変部分の切り出し画像を作成した。所見ありの画像についてはこうして手作業で切り出したが、所見なしの正常な画像については自動作成することを思いつく。乳房の部分を自動で切り出し、背景部分については自動的に除去するプログラムを作り、こちらについては2万1740枚を短時間で切り出すことに成功したという。

こうして、癌がある画像3802枚、癌がない画像4万3480の合計で4万7282枚のデータを集めた。このうち80%をAIのアルゴリズムを作るための訓練用に用い、残りの20%でテストした。癌がある画像と癌がない画像は同じくらいの枚数でないとうまく学習させることができない。そこで、癌がある画像と同じ枚数の癌なしの画像を用意し、このうち訓練用の癌なし画像だけを入れ替えて繰り返し学習させた(特許出願中)。

その結果、正診率96.6%、感度93.9%、特異度99.2%など、かなり精度が高いアルゴリズムを作ることができた。ただ、このアルゴリズムはあくまで研究用であり、この段階では臨床の場には役に立たない。そこで井上氏は次に、臨床で使う目的で自動的に読影するためのAIを作った。

このAIでは、マンモグラフィの画像上で、小さな枠を作り、その枠を画像上で少しずつスライドさせていく中で、乳癌があるところは赤く光るような機能を付けた。画像上で癌があるかないかを可視化することで、検診時でも使えるようなAIとなった。

多施設共同研究でマンモグラフィAI開発、5年後臨床応用へ


ただ、このAIは一施設内でのデータを用いてアルゴリズムを作ったため、機器や読影医の技術にそれほどバラつきがなかった。そこで、他施設でのマンモグラフィでも活用できるか検証するため、神奈川乳がん研究グループ(KBOG)とタッグを組んで、多施設と共同で研究を開始した。井上氏は「現在、2000症例くらい集まっており、今年度中に論文化を目指す」と話す。

米中などでも同様の乳がんを検出するためのAIについて研究開発が進められている。だが、井上氏は「日本人の乳房は大きさ、dense breastの程度が違う。日本人の日本人による日本人のためのマンモグラフィAIを少なくとも5年後に臨床応用させる」と目標を掲げる。

こうした臨床で利用できるAIが完成させられれば、検診の効率が上がる。現在は癌の見落としがないよう、人がダブルチェックしている。仮に読影医が一人検診を担当し、補助をAIにすることで人件費は半分になり経済効果が期待できる。さらに、精度が上がれば早期発見や見落としも減る可能性が高い。井上氏は「つらい思いをする患者さんとその家族を減らしていきたい」と話す。

dense breastを定量化評価へ


マンモグラフィによる乳がん検診の問題点としては、高濃度乳房がしばしばあげられる。乳がんは濃度が高いため、マンモグラフィの画像では白く映る。だが、乳腺濃度が高いと乳腺全体が白くなってしまい、そこから乳がんを見つけるのが困難になってしまう。現在の乳がん検診では、読影医が目視で判定するため、バラつきがあって客観性に欠ける。そこで井上氏は、脂肪組織を基準として、それと比べてどれくらい白いか、乳腺組織の輝度を求め、それを数値化することで定量化しようと考えた。

そのためにまず、自動運転などにも用いられている、Semantic segmentationと呼ばれる、画像から特定の範囲を切り取り、色分けするAIを用いた。これにより、まずは乳腺組織のみの画像を抽出することに成功した。次に脂肪部分の輝度を算出した。皮膚から少し離れたところの白さを数値化し、その平均を調べていく。そうして求めて脂肪の白さと比較して、乳腺がどのくらい白いかを数値化し、それを基にヒートマップを作って視覚化した。

このヒートマップから、乳腺の部分だけを取り出して、相対的な輝度の高さを算出することで、高濃度乳房かどうかを数字で判断できるようになった。これによってAIで高濃度乳房と判定した画像は、読影医の判定と77%の割合で一致している(特許出願中)。さらに、このAIを使って、乳がん患者の過去5年間のマンモグラフィの画像を検証してみたという。すると、実は3年前から輝度が高くなっていたことがわかった。井上氏は「仮にこのAIを検診で使っていたらこの患者さんは乳房を失わなくて済んだかもしれない」と話す。

そうしたことから、井上氏は「目視の読影ではマンモグラフィのポテンシャルを十分に活用できていない。乳腺の濃度を経年で評価することで、乳がんの早期発見にもつながる可能性も。今後は『AIか人間か』ではなく『AIを使う人間か、AIを使わない人間か』になる」と話して締めくくった。

 

 
二宮氏と井上氏の講演が終わった後、会場からは医療関係者から切実な声が上がった。その質疑応答は以下の通り。

会場:まずどこから手を付ければいいか、アドバイスが欲しい。

井上氏:AIをなんのために使うのか、目標を決めることが大事だ。私の場合はマンモグラフィで使えるAIを作るという最終課題を決めて、それに必要な情報を集めた。最終目標が見えてくれば頑張ることもできる。

二宮氏:少し突き放した言い方になってしまうかもしれないが、結局はやるかやらないか。今は、オンラインや書籍の教材はたくさんある。そういった教材とか参考となるホームページのURLとかを教えても、やる人はやるし、やらない人はやらない。

コーディネータの藤田卓仙氏:技術の進歩にキャッチアップするのは大変だろう。どういった立ち位置でAIやデータ解析に関わるかということが大事ではないか。最先端のAIを自ら開発したいのか、使う側になるのか。

井上氏:こういう世界におもしろくてのめり込むか、それともできあがったAIが入手できればいいか。そういう立ち位置がどこにあるかだ。本来、自分が何をしたいかを考えればおのずとポジションもわかってくるのではないか。プログラミングの技術などでは、本当のエンジニアにはかなわない。それでも、今回説明したAIぐらいは作れるし、また周りを啓蒙することもできる。例えば自分としては、医師としての専門性を持ったまま、エンジニアとの懸け橋になれればいいなと思っている。

二宮氏:社会実装をテーマに置いている。自分たちの力で5年以内に実現できそうなことのうち、グーグルなどに勝てる領域でやる。

藤田氏:いかに質の高いデータを作るかが重要だが、それには手間がかかる。どうやったらいいデータが集まるようになるか。

二宮氏:人が介在しない形でどうデータを収集するかということをテーマにしている。例えば、「リハビリを解析したい」という相談を受けたことがある。だが、リハビリ記録などがフリーテキストで格納されていると、データとしては全く使えない。ちゃんと記録ルールを設けて、カテゴリカルな値として格納されていれば使いやすいが、それでも入力漏れや記入者や施設によるバイアスは避けることができない。私だったら、入居者の位置情報や加速度から、どういったリハビリを行っているか定量的に評価、分類して、解析に使いたいと考える。

会場:AIに興味はあるが、やはりどこから手を付けていいのかわからない。

二宮氏:やらないことを決めるのが大事。医師であれば、コンピューターサイエンスの分野はやらないとか。Pythonなどの知識を座学で習得するなら、40~80時間くらいでできるのでまずはそこから始めるのもいいだろう。加えて重要になるのが、論文で読めるかどうかということだ。自分の専門分野に関する論文を読めればデータサイエンティストとも深い議論ができる。また、CTO(最高技術責任者)など、どういうパートナーに恵まれるかがカギを握る。データ解析においてはプロダクトマネジメントが重要だが、それもCTOがやってくれるならそれでもいいと思う。

井上氏:ひとには得意不得意があるので、仲間を集めることが大事だろう。例えば、プログラムが好きな人、やってもいいと思っている人、もしくはそういう人を知っている人を集めて、自分は得意なことに専念するというのもありだ。今はプログラミングができなくてもAIのアルゴリズムを作ることはできるため、プログラミングは必須ではない。

井上氏:イベントや勉強会に積極的に参加して人脈を作ることは大切だろう。

二宮氏:マニアックな領域はコミュニティーがあって情報が回っているので、いかにそこに地道に入っていくかがポイントとなる。こういう人に会いたいという要件を定義することが大事だ。

会場:私はリハビリを担当しており、AI活用の必要性も感じているが、上司の関心がない。そういう人にどうやって働きかければいいか。

井上氏:みんな「おもしろいな」とは言ってくれるが、実際に動いてはくれない。それでも、地道に訴え続けるのは重要だろう。あとは、相手に「目に見えてトクだな」と思わせるのが大事。モノをある程度作って、楽になる、残業代が減る、腰が痛くならない、といった具体的なメリットを見せる。そうやって一点突破できれば広がるだろう。 私はスタッフに恵まれた。当院の放射線技師は勉強熱心なので、そういう人たちにおもしろいと思わせたら自然と盛り上がっていく。

会場:(中身がブラックボックスな)AIと医師はどのようにして判断をすり合わせたり、役割分担したりしていくべきなのか。

井上氏:ずっとついて回る問題だろう。最近は「Explainable AI(説明可能なAI)」、つまり結果についてそこに至るまでの理由を説明してくれるAIの研究が進められている。AIはまだ発展途上。あと2~3くらい大きなブレークスルーが必要だ。だが、そのスピードはどんどん上がっていくだろう。

二宮氏:まずは医師たち(専門家)のサポートツールとして、協働していく形になる。AIの技術と運用が成熟していくにつれ、一般の方も直接AIを使うようになっていくだろう。