医療×AIセミナーシリーズ第4回「ゲノム医療とAI」
-
日程:2019年02月16日(土)
-
時間:15:00 - 17:00
-
会場:東京大学山上会館地下002会議室
医療現場での課題解決に向け様々なテクノロジーが導入される中、AI(人工知能)などの萌芽的技術の臨床現場での実装も始まりつつあります。現場での課題を熟知している医師による開発や実装、また医師と協働する開発者ら、社会実装に向けた仕組みをつくる政策関与者も増えてきました。
そこで、医療現場でのAIの活用を進める医師や開発者らを講師にお招きし、具体的な臨床現場の課題解決にどのように役に立つのか、現状と課題についてお伺いいたします。また、今後どのように実装されていくのか、政策関与者も含めて議論を行います。
湯地晃一郎(ゆじ・こういちろう) 東京大学医科学研究所国際先端医療社会連携研究部門特任准教授
1995年東京大学医学部医学科卒。2001年東京大学大学院医学系研究科内科学専攻修了(医学博士)。専門は血液内科学、臨床遺伝学、臨床薬理学、臨床検査学。虎の門病院血液科、東京大学医科学研究所附属病院血液腫瘍内科、同病院抗体・ワクチンセンターを経て2014年より現職。
西村邦裕(にしむら・くにひろ) 株式会社テンクー 代表取締役社長 CEO
2001年東京大学工学部卒業。 2006年 東京大学大学院工学系研究科 博士課程修了。博士(工学)。同大学の研究員・助教を経て、2011年に株式会社テンクーを創業し、代表取締役社長に就任。大学の頃から、VR技術など情報技術を用いて、医療・ヒトゲノム情報の解析や可視化の研究に従事。大学の研究を社会に還元するために起業し、ゲノム医療のためのトータルソリューションソフトウェア「Chrovis」の開発を始め、ゲノム医療を情報面から推進する活動を展開。東京大学がん遺伝子パネル検査「Todai OncoPanel」の先進医療Bの情報解析を担当し、臨床の現場で貢献できるよう取り組んでいる。受賞はMicrosoft Innovation Award、IPA未踏IT人材発掘・育成事業、文部科学省 科学技術・学術政策研究所の「科学技術への顕著な貢献2018(ナイスステップな研究者)」など。
東京大学政策ビジョン研究センター、慶應義塾大学メディカルAIセンター、エムスリー株式会社m3.com編集部は、2019年2月16日に医療×AIセミナーシリーズ第4回「ゲノム医療とAI」を開催しました。講師に湯地晃一郎氏(東京大学医科学研究所特任准教授)、西村邦裕氏(株式会社テンクー代表取締役社長CEO)をお迎えし、がんゲノム医療におけるAIの利活用・開発の現状と課題についてお伺いしました。
東京大学医科学研究所附属病院の湯地晃一郎氏は、東大医科研の取り組みを紹介し、AIのゲノム医療利活用の展望を紹介した。湯地氏はまず「AIは医療領域で既に導入済みだ」と述べた。心電図計や尿分析装置での自動診断がその一例だ。心電図の自動診断は1970年代に実用化され、今では自動診断システムなしでの検診は考えられないほど普及した。診断システムに加え、ICなど周辺機器技術の進歩により、安価で迅速に精度の高い診断が可能になり、医師や技師は他の業務に時間を割けるようになった。
AIと人間の医師の比較に関する総説中では (Topol E. Nat Med 25(1): 44–56, 2019.)、27報が紹介され、唯一日本からは、消化器病学分野で、昭和大学(森悠一先生)・名古屋大学らの大腸内視鏡診断の前向き研究が取り上げられている(Mori Y et al. Ann. Intern. Med 169(6):357–366, 2018. )。一方、米国食品医薬品局(FDA)が承認しているAIアルゴリズムは15種類。糖尿病網膜症を自動診断する「IDx-DR」は、ハードウェアは東京都板橋区の株式会社トプコン製だが、ソフトウェアは米国製だ。日本では内視鏡ソフトウェアのEndoBrainが2018年12月に医薬品医療機器総合機構(PMDA)による承認を受けている (AIを搭載した大腸内視鏡診断支援ソフトウェア医薬品医療機器等法(薬機法)承認のお知らせ)。
臨床シークエンスの実際
東大医科研において、診断困難な疾患のゲノム変異をAIが見出し、それに応じた薬剤の投与で患者さんを救命できたことが2016年8月に報道され、大きな話題になった。ヒトゲノムシークエンスの解析は次世代シークエンサーの登場以来、価格破壊が起き、いまやシークエンスデータを得るまでであれば10万円以下にまで下がっている。
「臨床シークエンス」とは体細胞とがん細胞から、DNAを抽出し、一人あたり数Gバイトから数百Gバイトのゲノム配列データを得て、数百から数百万の違いを見出し、大量の論文をもとに判断し、解釈結果を主治医にフィードバックすることで、患者さんの診断/治療を支援するものである。パネル検査や全エキソームシークエンスでは数Gバイトから数十Gバイトの、全ゲノムシークエンスでは数百Gバイトのデータが産生される。
東大医科研では2001年から遺伝カウンセリングと遺伝子検査体制が整備されており、がん個別化ゲノム医療の実践体制が整備されている。臨床遺伝専門医である湯地氏のような専門医に加え、生命倫理専門家、スーパーコンピューターを使い解析を行う情報工学者など、多彩な専門家がチームとして取り組んでいる。
解析においては膨大な量のデータが氾濫することになる。論文数も指数関数的に増大しており、完全に人間が読める量ではなくなっている。臨床シークエンスを行うと膨大なデータが生み出され、ゲノム変異が見つかる。その変異をいかに解釈し翻訳して、臨床側にフィードバックするかがボトルネックになっている。例えば、がんと関連する体細胞変異の情報を集積したデータベース「COSMIC.(Catalogue Of Somatic Mutations In Cancer.)」には、約3万報の論文からキュレーションされた 600万の変異情報が登録されている。だがこれらをいちいち人間の目で確認することは不可能だ。
IBM Watsonの活用
東大医科研では、IBM Watsonを2015年7月より利用している。IBM Watsonは2011年に人間のクイズ王に勝利したことで有名になったQAシステムで、2014年に事業化された。IBM Watson Healthは、文献解析、臨床検査の解析、がん治療の解析、ゲノミクス情報の解析、治験エントリーの解析など、様々なサービスを包含している。IBM Watson for Genomics (WfG) には、ゲノムデータベース、医学論文・学術出版物、臨床ガイドライン、化合物データベース、臨床試験情報、FDA承認薬情報など、様々な情報が格納されている。利用者が、患者の基本情報と遺伝子の変異リスト、遺伝子発現リストなどを登録すると、数分のうちにドライバー変異の一覧、対応する承認薬・未承認薬・適応外薬剤に関する臨床試験情報などを得ることができる。
がん患者の、正常細胞とがん細胞のシークエンスデータをスパコンによって解析すると、がん細胞で生じている数千から数百万の変異が見つかる。従来はこれを、専門医が解析し、解釈していたわけだが、この部分にAIを使うことで、飛躍的に速度と精度を高めて、効果が期待できる薬剤を探り当てることができるというわけだ。熟練した専門医が約1-2週間かかる作業の速度を、WfGを使うことで10分以下に短縮することができる。速度と網羅性においてAIは人を上回っている。
湯地氏は実例を示した。現在、臨床シークエンスは3.25日と、専門医のみが解析していたときと比較すると考えられないくらいの短い日数で実施可能になっている。隔週で各種専門家34人が会議 (tumor board)を行っており、臨床側に解釈の結果をフィードバックしている。
AI活用で難治性の症例の治療に成功
さらに具体的な症例を二つ紹介した。1例目は皮膚T細胞リンパ腫の症例で、全エキソーム解析を実施しドライバー変異は見つかったものの、介入可能な薬剤は見つからなかった。なお解析に要した時間は、専門医が1週間、WfGが5分だったという。
そこで全エキソーム、RNAを組み合わせたマルチオミックス解析を実施したところ、アクショナブルな候補薬剤が専門医では8剤、WfGでは11剤見つかった。解釈検討の結果、専門医が1個の遺伝子異常に対する標的治療を行ったところ、難治性腫瘤が治療薬剤投与により消失したとのことである。
2例目は急性骨髄性白血病の症例だ。全ゲノムシークエンスを行ったところ約8000個の変異が見つかり、WfGで解析したところ、専門医とWfGの解釈結果が一致した。新規の融合遺伝子が同定され、これにより特定シグナル経路の活性化が生じることから、この変異が病的であると解釈された。この特定シグナル経路を抑制する薬剤が投与され、腫瘍細胞は減少し完全寛解に至った。さらには、2つの遺伝子の融合遺伝子に対して、新たに融合遺伝子モニタリングアッセイ系が作成され、デジタルPCRアッセイ系の確立によって、治療効果の判定・再発予測に利用することができた。
診療プロセスは、診察、検査、診断、治療から構成され、診断仮説形成、治療戦略立案と進むが、湯地氏は上記の2例で、診断仮説形成、治療戦略立案において、AIが医師の支援を行っていることを具体的に紹介した。
2年間でのWatson for Genomics (WfG) の進化
AIの支援には、2016年と2018年ではだいぶ違いが出てきたという。専門医の判断とWfGの判断を比較すると、2016年時点では専門医しか検出できなかった変異や、WfGの判断の誤りが散見された。だが近年、WfG側に教育を行ったことで、WfGの誤りはかなり少なくなり、さらに新たな変異も検出されるようになった。
血液腫瘍疾患の186例での比較検討では、一致率は79%であった。専門医のみ、WfGのみが提示した変異について検討すると、専門医のみには、WfGが臨床的意義不明(VUS: variants of unknown significance)と判断した変異及びWfGの学習が必要だった変異が含まれ、一方、WfGのみには、ドライバー変異として証拠不足なもの、SNPs、そして、専門医の見逃しと考えられる変異が含まれていた。見逃し防止にAIは有用であることが示唆された。
さらに詳細な検討では、WfGによって提示され、専門医が新たに治療候補として追加した薬剤が複数症例で認められたことから、AIは専門医に新たな知識を提供できると考えられた。
WfGの薬剤候補は米国FDAの承認薬、未承認薬に基づき提示される。この薬剤候補を、日本人の患者さんにどのように提供していくかは重要な課題である。そこで東大医科研では、日本国内の臨床試験登録データベースに基づき、国内未承認薬についての臨床試験情報を提示するシステムを構築済である。AI提示結果に対する治療手段のアクセスを、患者さんにどう提供するかは、今後ますます重要となると湯地氏は述べた。
今後の展望 ゲノム情報とAIの組み合わせ
疾病は環境要因と遺伝要因から生じる。環境要因とは喫煙や飲酒、食事、運動などだ。それらが遺伝要因と組み合わさることで、がんなどの疾病という表現型が生じる。昨年、衝撃的な論文がNature Medicineに発表された(Coudray N et al. Nat Med 24:1559-1567, 2018.)。がん組織の染色画像から組織型と遺伝子型が予測できるという論文だ。組織型だけでなく6遺伝子(STK11, EGFR, FAT1, SETBP1, KRAS and TP53)の遺伝子変異の予測が可能というものである。病理画像から遺伝子変異が予測できるとすると、EGFR-TKIなど、遺伝子変異に基づく薬剤による精密医療が非常に容易になるため、インパクトは大きい。
ゲノム研究におけるAIの利用例として、大阪大学の岡田随象教授のNature Geneticsの論文が紹介された(Hirata J et al, Nat Genet, in press. doi:10.1038/s41588-018-0336-0.。次世代シークエンス技術を使って得たヒト白血球抗原(HLA)のゲノム配列情報に対して機械学習を適用することで、日本人集団のHLAは11パターンの組み合わせに分類できることが明らかになった。また東大医科研内のバイオバンク・ジャパン試料・データを用いて、日本人集団17万人のゲノムデータを対象にしたフェノムワイド関連研究 (PheWAS) が実施され、白血球の血液型の個人差が、病気や量的形質を含む50以上の表現型に関わることが示された。「このようなゲノム研究領域におけるAIの利用は今後ますます進んでくる」と湯地氏は述べた。
今後、ゲノム情報、マイクロバイオーム情報、表現型情報など、様々なマルチモーダル情報が、アルゴリズム解析されることで、精密医療がますます実現に近づくことが予測される。だが一方たとえば自動車の「レベル5(完全自動運転)」のような、AIが人間の介在なしに診断・治療を実施可能になるかというと「すぐには実現しないと考えている」と湯地氏は述べた。医療行為はあまりにリスクが高く、責任が大きい行為だからだ。2018年12月19日に、厚労省は通知(医政医発1219第1号)を発出した(人工知能(AI)を用いた診断、治療等の支援を行うプログラムの利用と医師法第17条の規定との関係について)。
通知では「AIを用いた診断・治療支援を行うプログラムを利用して診療を行う場合についても、診断、治療等を行う主体は医師であり、医師はその最終的な判断の責任を負うこととなり、当該診療は医師法(1948年法律第201号)第17条の医業として行われるもの」と記載されており、「医師でなければ、医業をなしてはならない」と定める医師法17条との関係を整理している。本通知は東大医科研の横山和明助教を主任研究者とする厚生労働研究(AI等を用いた診療支援に関する研究)を元に纏められ、湯地氏も分担研究者として参画した。
今後、AIを使うことで様々な課題も出てくる。法律、規制当局、個人情報保護と利活用などである。湯地氏は「国際的な規制調和も重要だ」と強調した。一度デジタル化されたゲノムを含む医療情報には容易に国境を超えるためだ。そして「米国と中国の間では現在、先端技術を巡り様々な摩擦が起きている。AIはその最たる例であり (Thomson N and Bremmer I. The AI Cold War That Threatens Us All. Wired. 2018.10.23.) 、ゲノム研究においても同様だ (坂田亮太郎. 米中NGS戦争は勃発するか? 日経バイオテク 2019.2.19. )。日本が世界の趨勢を知らずガラパゴス化していくことで『ジャパン・パッシング』されることを強く危惧している」と締めくくった。
次に株式会社テンクー代表取締役社長CEOの西村邦裕氏が登壇し、同社が東京大学医学部附属病院などと進めるがんゲノム医療について紹介をした。
ゲノム医療のためのトータルソリューションソフトウェア「Chrovis」
ゲノム医療のためのトータルソリューションソフトウェア「Chrovis(クロビス)」を開発している株式会社テンクーの西村邦裕氏は、もともとは東大のVR研究室の出身。テンクーは2011年に創業。2018年11月には、文部科学省の「科学技術への顕著な貢献2018(ナイスステップな研究者)」に選定されている。テンクーは社員数23人。ゲノム解析の結果を、AI技術を使って整理・解析して、人にわかりやすく提示して、アクションできるようにすることを目指している。そのため、社員にはデザイナーも入っており、患者や医師にわかりやすい情報の伝え方を意識しているという。
今日のようなゲノム医療の状況が来ることを予想して、ソフトウェア開発は2012年後半から始めていたという。AIについては、人の能力を増強するようなものとして考えており、人を代替するのではなく、判断は人が担うという考え方で開発を進めているという。
テンクーは、がんゲノムのデータ解析情報を医師にわかるようなかたちにレポートとしてまとめるソフトウェア「Chrovis」を開発している。西村氏は改めてシークエンスコストが下がっていることと、データ量が急増していることを示した。データ量が増えてきたので、情報系も役立つことができるのではないかと考えているという。
日本ではいま、「がん遺伝子パネル検査」を進めようとしている。適切な患者に適切な薬を渡す、そのためにコンピュータによる支援が可能なのではないかと考えられている。米国、イギリス、フランスや中国でも同じようなプロジェクトが動いている。
日本でも厚労省が様々なプロジェクトを始めており、がんゲノム医療の中核拠点病院を11カ所、その下に135カ所の連携病院をおき、社会実装を進めている。いまNCCオンコパネルとファンデーションワンが保険収載されるだろうと予測されており、今年4月以降に展開されていくと考えられている。それを踏まえて産学連携が進んでいる。テンクーは東京大学医学部附属病院の先進医療Bの情報解析を進めている。
Todai OncoPanelの解析
遺伝子変異には2つある。生殖細胞系列変異と体細胞変異だ。がんの場合は体細胞変異を見ることが多い。近年は分子標的薬の導入も大きな出来事だ。これまでは細胞全体をターゲットにしたのが分子標的薬によって異常がある部分に対して攻撃ができるようになってきた。また、免疫チェックポイント阻害剤の登場もある。効く人には効くことがわかってきた。
では、がんゲノム医療がやっているのは、どういうことか。病院での診察でがんとわかると、そのなかで検査を行い、病理医が診断を行う。ゲノム医療を行う場合にはこのあとに、その組織についてシークエンサーで遺伝子情報を読んでいくことになる。結果について、どの部分に変異があるのかを調べる。どういう変異にどんな意味があるのか、薬があるのかといった知見をアノテーションをつけていき、レポートにまとめなければならない。そして議論の結果、主治医と患者が話し合って治療を行うことになる。テンクーの「Chrovis」は遺伝子情報の解析とアノテーション、レポート生成を、ほぼ自動で行うことができる。
2018年8月から、東京大学が独自に開発したがん遺伝子パネル検査である「Todai OncoPanel(東大オンコパネル)」の臨床性能試験が先進医療Bで行われている。遺伝子解析は、東京大学がシスメックスの子会社である株式会社理研ジェネシスに委託して行われるが、得られた結果の分析は、テンクーに委託されている。テンクーではエキスパートパネルでの医師からのコメントを反映して、最終レポートを作り、電子カルテにアップロードして、かつ、患者向けレポートを作るところまでをほぼ自動生成している。
解析は、東大の分子ライフイノベーション棟のサーバで行われている。解析システムはいまオンプレミスで動いておりネットワークから遮断されているため、本郷三丁目駅の近くにあるテンクーから毎日社員が直接出向いて、作業を行っているという。
ゲノムシークエンスの実際
次世代シークエンサーに入れた検体の情報は、テキストベースのFASTQファイル形式で吐き出される。データ解析は基本的にはそれらのデータに対して解析を行い、変異を探す。西村氏は4行で1組になっているFASTQファイルを実際に見せながら解説した。
そのあとはリファレンスゲノムを使ってそれぞれのゲノムが合うように、ゲノム上の座標を特定していく。これをアライメント、あるいはマッピングという。変異を見つけるのは、何かしら変化しているところを見つけることになる。一文字だけ変わっている場合もあれば、一部の配列が丸ごと変わっている場合もある。それらを見つけていく。
知識データベースには、それに対して意味づけをするための情報が入っている。様々な公共DBや承認された薬の情報や治験の情報DBを全て統合して、横断的に検索できるようにしている。また、論文からの情報を使って支援するための仕組みも作っている。遺伝子変異についての情報を検索したり、日本の治験、FDAの薬があるかといったことを見つけられる。
インテグレーション、シソーラス、パラフレーズ検索、論文の自然言語検索
裏側の技術は4つあるという。データのインテグレーション、シソーラス、パラフレーズ検索、論文の自然言語検索だ。データのインテグレーションとは、様々なズレがある情報を正規化したり、クレンジングしたり、名寄せするための仕組みだ。それぞれにエンジンを作って統合的に綺麗にする仕組みを作っており、データを横串検索できるようにしているという。
シソーラスは表記のズレを吸収するための仕組みだ、遺伝子の名前は変わっていたり、複数の名前があることもある。薬は一般名、商品名、治験名、作用名などがある。これらが同じものであることを教えるために整備してやる必要がある。
さらに検索効率を上げるためには、人間による自然言語で書かれているため、言い換えが多く、その漏れをふさぐ必要がある。これがパラフレーズ検索で、表記揺れも吸収して翻訳も必要となる。阻害剤だろうがインヒビターだろうが、ヒットできるようにする。再帰的に組みあわせ検索をすることによって、人が様々な書き方をしても拾えるようにしているという。これは今年1月に開催された、第1回日本メディカルAI学会学術集会で最優秀賞を獲得した。検索しているキーワードと出て来るヒットが違っても見つけることができるシステムを実現しているという。
論文の自然言語処理は、大量の論文の絞り込みのための技術だ。論文のアブストラクトと本文にそれぞれ自然言語処理を行なっている。公共のDBには、エビデンスとして論文のリファーのデータが載っている。それらを全部持ってきて学習の教師データとする。それに論文のアブストラクトを読み込ませて学習モデルを作り、それに対して2800万の論文を入れるとスコアリングができて、データが抽出できる。論文本文テキストに対しても同じようなことを行う。何か面白いものが見つかったときに検出できるようにしているという。たとえば肺がんを検査すると、右側にスコアリングが出て、治験情報なども出てくる。西村氏はデータベースのデモを行いながら紹介した。
このような知識DBを使って、レポートを自動で作成する。たとえばEGFRという遺伝子があったとしたら、それに対してどんな承認薬があり、それをどう提示するかといったことをやっているという。裏側では各ステップのAPIが連携しており、DBにAPIで問い合わせすれば、それがすぐに帰って来る。たくさん変異が出てきた場合は変異ごとに問い合わせをして拾ってきてレポート化する。そしてカンファレンスを行い、症例提示があったときの情報の一つにゲノム情報を入れて示しているという。治験があるのか、論文報告があるのかといった情報なども一緒に表示される。
強みはプログラムを1から作り、既に現場で2年間動かしていること
Chrovisでは、このようなデータ解析、知識DB作成、レポート作成をほぼ自動で行なっている。最終的には人が見てチェックし、整える。テンクーの強みは「プログラムを1から作っていること」だという。オープンソースもいっぱいあるが自分たちでコントロールするために一から全て作り直しているという。もちろん臨床現場に使えるものにしている点も強みだ。既に2年くらい現場で回しており、ブラッシュアップされているという。
最後に課題として、今はオンプレミスで動かしていることについて、セキュリティではいいが、ゲノムの計算量や知識量を考えると絶対にオンライン、クラウドのほうがいいとコメントした。臨床の現場に役立つ情報をどう提供できるのかも今後の課題だという。日本では治験情報が不十分であることも課題だという。各種DBがバラバラで、アップデートなど情報整備も問題となっているという。
また、医療の世界では情報技術に対する理解がある医師とそうではない医師がいる点も問題だと述べた。これまでの医療の世界ではハードウェア、あるいは電子カルテがメインだった。ゲノム医療のような情報系技術についてはまだギャップがあり、「もったいない」と感じているという。もちろん薬事の問題もある。西村氏は最後に「この技術を日本発で作り、今後は海外にも展開していきたい」と締めくくった。
講師プロフィール
湯地晃一郎(ゆじ・こういちろう) 東京大学医科学研究所国際先端医療社会連携研究部門特任准教授
1995年東京大学医学部医学科卒。2001年東京大学大学院医学系研究科内科学専攻修了(医学博士)。専門は血液内科学、臨床遺伝学、臨床薬理学、臨床検査学。虎の門病院血液科、東京大学医科学研究所附属病院血液腫瘍内科、同病院抗体・ワクチンセンターを経て2014年より現職
西村邦裕(にしむら・くにひろ) 株式会社テンクー 代表取締役社長 CEO
2001年東京大学工学部卒業。 2006年 東京大学大学院工学系研究科 博士課程修了。博士(工学)。同大学の研究員・助教を経て、2011年に株式会社テンクーを創業し、代表取締役社長に就任。大学の頃から、VR技術など情報技術を用いて、医療・ヒトゲノム情報の解析や可視化の研究に従事。大学の研究を社会に還元するために起業し、ゲノム医療のためのトータルソリューションソフトウェア「Chrovis」の開発を始め、ゲノム医療を情報面から推進する活動を展開。東京大学がん遺伝子パネル検査「Todai OncoPanel」の先進医療Bの情報解析を担当し、臨床の現場で貢献できるよう取り組んでいる。受賞はMicrosoft Innovation Award、IPA未踏IT人材発掘・育成事業、文部科学省 科学技術・学術政策研究所の「科学技術への顕著な貢献2018(ナイスステップな研究者)」など。