「中耳真珠腫」の進展範囲をCTのみで診断するAIを開発、世界初－慈恵大ほか

読了時間：約 4分34秒

2022年10月06日　AM11:01

少ない症例数でも中耳真珠腫の進展度を診断できる手法を開発

東京慈恵会医科大学は10月4日、中内耳CT水平断のみを用いて有病率の低い中耳真珠腫乳突腔進展に関する高い精度の人工知能診断システムを作製することに、世界で初めて成功したと発表した。この研究は、同大耳鼻咽喉科学講座の高橋昌寛助教、山本裕教授、小島博己講座担当教授、同・放射線医学講座の馬場亮助教、尾尻博也講座担当教授らと、サイオステクノロジー株式会社の野田勝彦氏、吉田要氏らとの研究グループによるもの。研究成果は、「PLOS ONE」に掲載されている。

画像はリリースより
（詳細は▼関連リンクからご確認ください）

中耳真珠腫は骨破壊・脳膿瘍などの致命的な合併症を起こし得る難治性の慢性増殖性疾患で、高い再発率が問題となっている。病変の範囲により耳後部切開の必要性など、さまざまな手術方法の選択を検討する。中でも乳突腔への進展は、経外耳道的内視鏡下耳科手術の適用などさまざまな判断に影響を与える。しかし、現在の画像検査では病変の範囲を十分に確認できず、術中にアプローチの変更を余儀なくされることがある。画像検査としてはまず、高解像度CTを用いて、真珠腫の範囲やその合併症の術前評価が行われる。しかしCT上では、真珠腫と炎症性変化の部分は類似した陰影を示すため、区別することは難しいのが現状だ。MRI（特に、nonEP DWI）を用いることで診断可能な症例もあるが、MRI検査を実施できる施設の地域差が大きく、費用や時間がかかるという点、金属や閉所恐怖症などの制約がある。さらに、MRIを実施しても解像度に限界があるため、診断することができても病変の範囲を正確に把握することは困難だ。そのため、CTの診断精度を向上させることが重要と考えられている。

近年の人工知能（AI）や機械学習技術の革新は医療分野の大きな進歩をもたらしている。機械学習による予測の実用化は2000年に始まり、その後、コンピュータのハードウェア性能の劇的な向上により、2010年に深層学習（Deep Neural Network：DNN）が導入された。2012年には、ImageNet Large Scale Visual Recognition Challengeにおいて、DNNの精度が従来の画像処理手法を上回り、最終的には2015年に人間の画像認識精度を上回った。しかし、DNNモデルの学習には一般的に大量のデータが必要であり、希少疾患の診断への応用は依然として困難な状況だ。少ないサンプル数で精度を向上させるシステム解析手法の開発は、医療AI研究の重要な課題となっている。中耳真珠腫の有病率は2万5,000人に1人と低いため、DNN学習データの利用はさらに制限される。そこで研究グループは今回、限られた症例数でも真珠腫の進展度を診断可能な手法を開発することを目的とした。また、実用性を判断するために、作成したDNNモデルと耳鼻咽喉科医が行う評価を比較した。

AIと経験3～33年の耳鼻咽喉科医15人が同じCT画像を読影、乳突腔進展の有無を診断

研究では、2011～2020年に東京慈恵会医科大学附属病院耳鼻咽喉科において、弛緩部型真珠腫に対して初回手術と治療前評価のための側頭骨CTを受けた164例（男性104例、女性60例、年齢層13～82歳、平均年齢［±SD］42.0±15.3歳）（右83 例、左81例）を対象とした。弛緩部型真珠腫の診断は術中所見および摘出組織の病理組織学的検査に基づいて行った。乳突腔進展を示す症例（M+）と進展を示さない症例（M-）の2群に分類したところ、80例と84例がそれぞれM+とM-に分類された。CTの閾値は骨条件で行い（window center：700、window width: 4000）、患者情報は削除し、水平断画像のみを用いて、上半規管の頭側から尾側方向に30スライスを抽出。そのうちDNNモデルの学習と評価のために病変部が含まれるスライスを抽出。患者を無作為に8グループに分け、学習用と評価用を分けて交差検証を行った。

学習時には、224×224ピクセルのサイズに切り出した画像を用いて、画像の病変部を範囲内に収めながらDNNモデルを学習させた。1つのDNNモデルの1回の学習サイクルでは、50回の反復学習を繰り返し実行。この学習サイクルを8つのデータセットで行い、1つの学習セットで8つのモデルを生成した（学習セット：評価セット＝7：1）。各DNNモデルの学習は少数の患者からオーグメントで生成した大量のデータを用いるため、学習するたびに能力・精度に差が出る。その能力・精度の変動を検証するため、24の学習セットを作成した。その結果、8データセット×24＝192個のモデルが生成された。

さらに、AIが評価した画像と同じ水平断CT画像を、経験年数3～33年の耳鼻咽喉科医15人が読影し、乳突腔進展の有無についてそれぞれ診断した。

最良のAI診断モデルでの平均予測精度81.14％、耳鼻科医は73.41％

単一画像単位予測における最高の精度は25％画像に対するアンサンブル予測によって実行された際の75.43％（感度=77.12％、特異度=73.75％）だった。患者単位予測における最高の精度は、25％画像に対するアンサンブル予測によって実行された81.14％（感度=84.95％、特異度=77.33％）だった。この結果から、アンサンブル予測は単一モデルの予測よりも精度が良く、25％画像に対する予測は、元画像（100％画像）の予測よりも良い性能をもたらすことが明らかになった。

これに対し、耳鼻科医の診断精度は平均73.41％（感度83.17％、特異度64.13％）だった。診断医が少ないため断定はできないとしているが、臨床経験による明らかな影響は見られなかった。

乳突腔進展とCT陰影の有無の正答率の差、耳鼻科医は15～20％、AIは10％以下

また、術中所見における乳突腔進展有無による違いとCTにおける軟部陰影有無による違いをそれぞれ検討したところ、耳鼻科医では術中の実際の乳突腔進展の有無についてもCT陰影の有無についても正答率に15～20％の差があったのに対し、AIでは10％以下の差に留まったという。

さらに、術中所見とCTの陰影が一致しているか否かによる違いは、耳鼻科医が65.1％（87.7-22.6％）、AIが33.2％（84.0-50.8％）だった。これらのことから、耳鼻科医は主に陰影の有無で判断しているがAIはそうではないこと、人間が判断しにくい症例でAIの方が正答率の高い症例があることが示唆された。一方、耳鼻科医が容易に診断できるがAIの精度が低い症例もあった。これは、耳鼻科医は乳突腔を明確に定義できることと、耳鼻科医にとって一般的な所見であっても、あまりにも著しい進展例でAIが初めて見る画像ではAIの十分な性能を発揮できないためと考えられるという。しかし、この点について研究グループは、症例数を増やすことで解決されると思っている。少ない症例数で高い精度のAIを作成できたが、今後はより大規模な多施設共同研究の施行が望ましいとしている。

他の有病率の低い疾患に対する解析も実施予定

今回の研究により、AIが中耳真珠腫の進展範囲の微細な特徴を捉え、CTのみで診断することが世界で初めて可能となった。

「中耳真珠腫の有病率は低いが、学習方法の工夫で高い精度の診断システムを作成できた。これにより、適切な治療選択が可能となる。今回の経験を生かし、他の有病率の低い疾患に対する解析も行っていく」と、研究グループは述べている。（QLifePro編集部）

▼関連リンク
・東京慈恵会医科大学　プレスリリース