複数の医療データセットの統合学習、画像解像度の差などから困難
早稲田大学は6月16日、解像度や対象の異なる医療画像を、1つの医療AIモデルで同時に扱える新技術「PatchMoE」を開発したと発表した。今回の研究は、同大大学院情報生産システム研究科博士後期課程のWang Jiazhe氏、同研究科の吉江修教授、家入祐也講師らの研究グループによるもの。研究成果は、「Neural Computing and Applications」にオンライン掲載されている。

画像はリリースより
(詳細は▼関連リンクからご確認ください)
医療画像における自動セグメンテーションは、診断支援や治療計画の精度向上を目的として広く研究されてきた。これまでの研究では、個別の医療タスクごとに専用のモデルを学習するアプローチが主流だったが、この手法はタスク間の知識共有が困難であり、モデルの冗長性や性能限界が課題だった。特に近年では、大規模な汎用モデルを事前学習させた上で、医療データへ転移学習する方法が注目されている。この方法により、大量のアノテーションを必要とせず、高い精度が得られることが確認されていたが、一般画像と医療画像の構造的違いにより、医療画像特有の詳細な特徴を十分に学習できないことが問題だった。また、複数の医療データセットを統合して1つのモデルで学習させる場合、画像解像度の差やアノテーション基準の違いから、最適化の方向性が競合し合う「パレート効果」と呼ばれる問題が発生し、すべてのタスクで高い性能を同時に達成することが難しいとされていた。
パッチベース処理と専門家デコーダ組み合わせた新手法「PatchMoE」提案
今回の研究では、解像度やアノテーション基準の異なる複数の医療画像データセットを、1つのモデルで統一的に学習できる新たな手法「PatchMoE(Patch-based Mixture of Experts)」を提案した。これは、混合データセットに起因する学習の干渉や精度低下の問題を克服することを目指している。提案手法の主な構成要素は、「パッチ分割と3次元パッチ位置表現(Patch Position Embedding:PPE)」「専門家混合型デコーダ(Mixture of Experts:MoE)」の2つである。
PPEは、PPEモジュールにより、画像を固定サイズの小領域(パッチ)に分割し、それぞれのパッチに「データセットID」「画像ID」「パッチID」の3次元情報を特徴空間に埋め込むことで、空間的・構造的な情報を保ったままTransformerベースのモデルに入力する。これにより、異なる解像度の画像を扱う際にも空間的関係を維持し、コンテキスト理解を損なうことなく一貫した特徴抽出が可能となる。
MoEは、デコーダ部分において、データセットIDに基づいてまれな構造を持つMoE機構を導入し、各タスクに適した専門家ネットワークの組み合わせを動的に選択することで、マルチタスク学習における最適化の競合(パレート効果)を抑制する。
腹部臓器など4種類のデータセット検証、Diceスコア平均3.04%の精度向上を実現
PatchMoEは医療画像分野で初めて、パッチベースのContrastive Learning(対照学習)を導入している。対照学習を用いることで、同一画像内の近接パッチの特徴を近づけ、異なる画像やデータセット間のパッチは区別するよう学習させている。これにより、混合データセットにおけるパッチ間の文脈理解が促進され、特徴表現の精度が向上した。PatchMoEは、網膜血管(DRIVE)、近赤外血管(HVNIR)、消化器ポリープ(Kvasir-SEG)、腹部臓器(Synapse)の4種類のデータセットを用いた画像セグメンテーションにおいて検証され、既存の最先端手法(GCASCADEなど)と比較して、平均Diceスコアで3.04%の精度向上を達成した。
今回の研究で提案したPatchMoEは、解像度や構造の異なる複数の医療画像を1つのモデルで統合的に解析できる点が特徴である。この技術により、特定の臓器や撮影条件に依存しない、より汎用的で柔軟な画像解析が可能となった。今回、複数の代表的な医療画像データセット(眼底・手血管・消化器・腹部臓器)を用いて、その有効性を検証している。これにより、従来のように、各タスクに対して異なるAIモデルを用意する必要がなくなり、開発コストや医療データ活用の効率が大きく向上する可能性がある。また、学習データが限られている疾患や施設間で画像仕様が異なるケースにおいても、今回の手法は高い適応性を示すことが確認されており、将来的には多施設間で共有可能な診断支援AIの基盤技術として活用が期待される。
未知データや3D画像への拡張などの課題のほか、臨床的有効性の評価も進める
今回の研究で提案したPatchMoEは、異なる医療画像データセットに対して高精度なセグメンテーション性能を示したが、現状では各データセットに識別ID(dataset ID)を明示的に付与して処理を分けている。この仕組みは既知のデータセットには有効だが、将来的に未知のデータやより細かなタスク分類への対応を目指すには、より柔軟で汎化可能な専門家選択手法の構築が必要である。
また、現行の検証は2D医療画像を対象としており、CTやMRIといった3D画像への拡張などについては今後の検討課題のひとつである。これらに対応することで、PatchMoEはより幅広い医療応用への展開が可能となる。「今後は、より多様なデータセットを用いた検証や、実医療環境下での臨床的有効性の評価も進めていく予定である」と、研究グループは述べている。
▼関連リンク
・早稲田大学 ニュース