人工知能(AI)の普及で読影医の仕事は自動化されるという未来がよく描かれます。しかし人口が世界最多の中国でも、個別の症例となると、人工知能を学習させるに十分なデータ数が集まらないそうです。
お化け屋敷は入口が一番怖い
技術的特異点(シンギュラリティ)とは、人工知能(AI)が人間の能力を超える時点のことを指す言葉です。”Rise of the Robots” を読んだとき、ちょっと背筋が寒くなりました。ヒトが人工知能を持ったロボットに労働を奪われて、最低限の所得保障(ベーシックインカム)で暮らしていく未来がもうそこまで来ているように思えたからです。
特に専門的知識を必要とする職業が真っ先に労働を奪われる可能性があるのはうなずけました。あまり体を使わずにデータと知識だけで判断する仕事は自動化に持って来いだからです。その最たるものが読影医さんが行う医療画像診断です。いろいろな企業が参入していて、一部では一線のベテラン読影医さんたちの診断精度を超えるレベルに達しているのは事実です。
この本の中でも、読影医の仕事は自動化されて、代わりにそれほど専門知識を必要とせず、比較的低賃金の準医師が人工知能の下した診断結果をもとにしてしっかり患者さんと向き合って、治療する未来を描いています。
I suggested that there may eventually be an opportunity to create a new class of medical professionals: persons educated with perhaps a four-year college or master’s degree, and who are trained primarily to interact with and examine patients—and then to convey that information into a standardized diagnostic and treatment system. These new, lower-cost practitioners would be able to take on many routine cases, and could be deployed to help manage the dramatically growing number of patients with chronic conditions such as obesity and diabetes.
Ford, Martin. Rise of the Robots (p. 151). Basic Books. Kindle Edition.
しかし中国の 36Kr.com の記事を読むと、ひょっとしたらお化け屋敷が一番怖いのは入口だけということと同じと思えてきました。
「専門」と一口に言っても間口をくぐると広い
本記事によると、ガンといっても体のいろいろな部位で発生して、それぞれ異なる特徴を持っているので網羅的に画像で特定するのは難しいようです。伝家の宝刀でバッサリとはいかず、ロングテールのしっぽをちまちまと叩いていかないとダメなようです。
例えば、肺の病気とお隣の心臓疾患とは場所は近くても見た目も性格も違うので、同じ方法を使って画像から病変を特定できないわけです。
そうすると、それぞれ同じ疾患のデータをたくさん集めてきて個別に人工知能に「こういう形のものは悪性腫瘍」などと覚えさせる必要があります。
しかし、それもそう簡単ではありません。如何に中国が世界の5分の1の人口を有するとしても、個別の症例となると、人工知能を学習させるために十分なデータ数が集まらないそうです。学習が中途半端に終わるのです。日本では何とかコロナ禍が爆発せずに踏み止まっています。それが災いして国産ワクチンの治験に必要なデータ数が集まらないのとどこか似ています。
数据之殇,成为医疗AI领域无比突显的挑战。深睿医疗的首席科学家俞益洲(港大教授,IEEE Fellow)也曾直言:医疗AI训练数据少,数据分布高度不均匀,数据标注的一致性较差,数据类型多(多模态影像,文本+影像)。
36Kr.com 《医疗AI,影像简史》
脳をより深く調べ尽くして汎用人工知能を作るのが近道か
上記の事例を見ると、患者数が多い疾患であれば、特化型の人工知能が学習するために十分なデータ数を集められるのでベテラン読影医さんを凌ぐ精度の高い診断を実現できそうですが、そうでない多岐にわたる疾患には手が回りそうにありません。
そうなると、ヒトの脳をより深く調べて、学習するためのデータが数万件程度必要な特化型人工知能ではなし得ない、少数のデータでも「勘」が働く脳の仕組みを解明して汎用人工知能を作る方がより近道に思えてきます。
現在普及している特化型人工知能は画像認識が主流です。画素数が多くて高精細なほど、階調が細かくて何万色を表現できるというようなデータを使って得られる結果の精度は高いものになるでしょう。しかし計算時間は当然長くなります。現実的な時間で割り切って判断するけれども、精度は落とさないというところに人工知能エンジニアたちはしのぎを削っているのです。
やはり言葉が大事なのではないか
ヒトは見聞きしたことを言葉にして脳に記憶しています。ScienceDaily.com に “Mapping words to colors” という記事がありました。驚いたことに世界の 130 種類の言語を調べたところ、どの言語も色の表現の種類は似たようなものになるそうです。色のスペクトルは連続的でどのように区切って名前を付けるかは勝手なわけですが、それを似たような有限の数の色の表現に落とし込んでいるのです。
Languages differ, cultures differ, but our eyes are the same
ScienceDaily.com, “Mapping words to colors”
こうして見ると、ヒトはアナログ情報を言葉を使ってデジタル情報に変えて情報量を抑えた上で、脳の中で高速に情報処理しているのでしょう。
言葉を学ぶことは汎用人工知能に辿り着く近道かもしれません。
コメント