先日、とある共同研究をはじめた。研究相手は病理AIで名高いメドメイン株式会社。消化管のとある病気について、ぼくが過去に診断したプレパラートをデジタルデータに取り込み、機械学習モデルに病理診断させて、ぼくの診断と対決させ、その結果を論文にする。
機械学習モデルの病理診断にはヒートマップ方式を用いる。「この細胞はがん、この細胞は正常」と逐一判定するのではなく、「ここからここまでがかなりがんっぽい、ここからここはがんの可能性がある」と、あたかも天気予報のおねえさんが気象図に予想最高気温や雨量を色で塗り分けるかのように、プレパラートの写真上に「がんである確率」を色づけする。
なんだそんなやり方か、と思うことなかれ。かなりの精度でがんを正しく描き出してくれる。このモデルが本格的に稼働したらかなり便利なことは間違いない。
というわけで、ぼくは研究の準備をする。
まず、ぼくがこの10年で診断した人の中から、今回機械学習に読ませるプレパラートを選び出す。入力支援システムの検索機能によって、ぼくが過去10年に診断した、のべ40000人の患者の中から、今回の検討に合致する診断名を探り当てる。
数十分かけて検索をして、結果的に413名に絞り込まれた。40000件あるわけだから1%くらいだ。たったこれだけか……。
その413名の病理診断をこんどはひとつひとつ自分の目で確認していく。3名ほど、珍しい病気すぎて今回の検討では論点がブレブレになってしまう人を除く。また、1名、検体の状態があまりよくなくて診断に苦労した人を除く。これで409名。
では、409症例を検討するのかというと……。じつは、一度の手術で病変が2つあった患者や、3つあった患者というのがけっこう紛れている。そのあたりをきちんと確認する必要がある。結局、409例の患者に478病変が含まれていた。この症例を対象とする。
さて、478病変あるからプレパラートも478枚? いや、違う、ひとつの病変につき3~10枚程度のプレパラートがあるのだ。
これらのプレパラートは、しまってある倉庫から出す手間がある。2500枚以上のガラス、それも倉庫のあちこちに散らばっているガラスを慎重に取り出してこなければならない。このあたりでひとつ心折れる。
ようやく出してきたプレパラートはいずれも自分でかつて見て診断を書いたものであるが、今回、検討をするにあたって、すべて見直す必要がある(ガラスや染色の状態をチェックする)。ここでふたつ心折れる。
最後にプレパラートは共同研究施設のメドメインに送ってデジタルスキャナで画像を取り込んでもらい、バーチャルスライドにすることで機械学習が可能となるのだが、このガラスを箱に詰めて緩衝材に包んで箱詰めしてクロネコヤマトまで持っていく作業は人力である。ここでみっつ心折れる(ついでに背骨も何本か折れる)。
こうして多くの時間と多大なカロリーと精神力を使用してようやく検討できるのが、
人体病理
┗ 組織病理
┗ HE染色病理
┗ 消化管病理
┗ (ある臓器)病理
┗ がん
┗ある分化度、ある深達度
なのである。ものすごく細分化した部分を必死でやっている。
もちろん、いちど構築したデータは人間と違ってAIは忘れない。しかし、もっといいプログラムができたらAIごと入れ替わってしまうこともある世界だ(『クララとお日さま』を思い出す)。
AIとの対決は人間の体力を奪う。診断の精度? それ以前の問題だ。ぼくはAIによって筋トレをしていると言っても過言ではない。AIは人間にとって夢のような存在で、ぼくらを健康にする手伝いをしてくれる。