この新しい AI モデルはがん診断のベンチマークをどのように設定するのでしょうか?



最近の研究では、研究者らは Prov-GigaPath と呼ばれる AI ベースの疾患モデルを開発し、評価しました。研究者らによると、これは実際の症例からの大規模なデータセットに基づいて訓練された、がん細胞診断のための初の全スライド病理学ベースラインモデルであるという。

コンピューター病理学は、専門家が病気のサブタイプ、段階、起こり得る進行状況を特定できるようにすることで、がん診断の変革に役立ちます。多くの研究で、機械学習と深層学習は、さまざまな種類のがんの早期発見においてより良い結果を示しています。

こちらもお読みください: 科学者ががん免疫療法を改善する AI ベースのモデルを開発

Providence Health Systems とワシントン大学が最新の調査研究を実施し、 Journal Nature に掲載されましたマイクロソフト社内のいくつかのチームも協力して調査を促進しました。

Prov-GigaPath はがんを診断します

Prov-GigaPath は、がんの評価と診断に広く応用されているホールスライドイメージング法に基づいています。

この新しい AI モデルはがん診断のベンチマークをどのように設定するのでしょうか?
Prov-GigaPath モデルのアーキテクチャを示すフローチャート。

ホールスライドイメージング技術では、腫瘍画像の顕微鏡スライドが高解像度のデジタル画像に変換されます。これらのスライド全体の画像には、腫瘍の微小環境を理解するのに役立つ重要な情報が含まれています。

「Prov-Path は、画像タイル数の点で TCGA の 5 倍以上、患者数の点で TCGA の 2 倍以上です。」自然。

Prov-GigaPath は、28 のがんセンターを持つ Providence Health Network の Prov-path と呼ばれる大規模なデータセットでトレーニングされます。データセットには、171,189 枚の実際の顕微鏡スライドからの 13 億を超える画像タイルが含まれています。スライドは 30,000 人を超える患者の生検と切除中に作成され、31 の主要な組織タイプをカバーしています。

Prov-Path データセットには、がんの病期分類データ、関連する病理学レポート、ゲノム変異プロファイル、および組織病理学的所見も含まれています。これらのさまざまなデータを組み合わせることで、モデルの状態をより深く理解できるようになります。

GigaPath により、ギガピクセル スライドの識別が向上します

GigaPath は、Prov-GigaPath がギガピクセル病理スライドを評価するために使用する新しいビジョン トランスフォーマーです。画像タイルが視覚的なトークンとして使用される場合、完全なスライドは一連のトークンになります。シーケンス モデリングの複雑なモデルを単純化するために、ビジョン トランスフォーマーはニューラル アーキテクチャです。

この新しい AI モデルはがん診断のベンチマークをどのように設定するのでしょうか?
がんのサブタイプを示す棒グラフ。

重要なのは、各顕微鏡スライドには膨大な数のタイルがあるため、従来のビジョン トランスフォーマーをデジタル病理学に直接適用することはできないということです。 Providence データの場合、スライドの数は最大 70,121 枚です。研究者らは次のように述べています。

「この問題に対処するために、私たちは最近開発した LongNet メソッドを適応させることで、自己拡張注意を利用します。」

機能を変化させる遺伝子変異の多くはがんの進行に関与しており、がんの診断と予後の両方で検査することができます。この研究では、配列決定コストが大幅に減少したにもかかわらず、医療格差が依然として存在していることが判明した。このギャップの主な要因は、世界中で腫瘍配列決定へのアクセスであると考えられています。

研究者らは、病理画像から腫瘍の変異を予測することで、個別化された治療法や薬剤の選択に役立つ可能性があることを強調した。

研究者は疾患モデルを比較します

標準的なギガピクセルのスライドは通常、従来の自然画像よりも数千倍大きいため、デジタル病理学には計算上の課題が伴います。従来のビジョントランスフォーマーには限界があり、データ量が増えると計算要件が増大するため、このような巨大な画像を処理するのが困難になります。

こちらもお読みください: AI ツールががんと闘う際の免疫反応を予測

もう 1 つの点は、これまでのデジタル病理学研究では、各顕微鏡スライド内の異なる画像タイル間の相互依存性が利用されていなかったことです。相互依存関係のリンクを無視することにより、スライド レベルのコンテキストが削除されます。これは、腫瘍微小環境のモデリングなど、多くのアプリケーションにとって重要です。

研究者らは、研究のために Prov-GigaPath を、HIPT、Ctranspath、REMEDIS などの他の公的に利用可能な病理学ベースライン モデルと比較しました。研究者らは、次のように述べているように、Prov-gigaPath が 26 タスク中 25 タスクで優れたパフォーマンスを示したことを発見しました。

「Prov-GigaPath は、2 番目に優れたモデルである REMEDIS と比較して、AUROC (分類モデルのパフォーマンス指標) で 23.5% の向上、AUPRC (不均衡なデータセットを扱う場合に有用な指標) で 66.4% の向上を達成しました。」

がんは致命的な病気になる可能性があり、毎年何百万人もの命が奪われます。デジタルパソロジープロバイダーであるペイジ社の共同創設者兼主席科学者であるトーマス・フックス氏はCNBCのインタビューで次のように述べています。これは医療棟全体の基本的なステップです。」

ご存知のとおり、従来の病理学的技術は主に顕微鏡による組織サンプルの観察に基づいているため、病気の診断に貢献してきました。しかし、テクノロジーと人工知能がすぐに使えるようになったことで、実践が変化し、腫瘍を特定して分類するプロセスが加速しました。ほとんどの AI 病理学モデルは、顕微鏡でスライドを検査する同じ技術をデジタル的に活用しています。


アーミル・シェイクによるクリプトポリタンのレポート