クラスタリング
Scientific Reports volume 13、記事番号: 12701 (2023) この記事を引用
メトリクスの詳細
デジタル病理学に適用された機械学習は、腎機能を評価し、慢性腎臓病 (CKD) の根本的な原因を診断するためにますます使用されています。 私たちは、教師なし学習を利用して腎臓組織の局所的な視覚パターン間の空間関係を学習する、新しい計算フレームワークであるクラスタリングベースの空間解析 (CluSA) を開発しました。 このフレームワークにより、時間のかかる非現実的な専門家の注釈の必要性が最小限に抑えられます。 172 個の生検コアから得られた 107,471 枚の病理組織画像がクラスタリングと深層学習モデルに使用されました。 生検サンプル上のクラスター化された画像パターンに空間情報を組み込むために、クラスター化されたパターンを色で空間的にエンコードし、グラフ ニューラル ネットワークを通じて空間分析を実行しました。 CKD を予測するために、さまざまな特徴グループを備えたランダム フォレスト分類器が使用されました。 生検時の eGFR の予測では、感度 0.97、特異度 0.90、精度 0.95 を達成しました。 AUCは0.96でした。 1 年間の eGFR 変化の予測では、感度 0.83、特異度 0.85、精度 0.84 を達成しました。 AUCは0.85でした。 この研究は、教師なし機械学習アルゴリズムに基づいた最初の空間分析を示しています。 専門家の注釈なしでも、CluSA フレームワークは、生検時および 1 年後の腎機能の程度を正確に分類して予測できるだけでなく、腎機能と腎予後の新しい予測因子を特定することもできます。
慢性腎臓病(CKD)は腎機能が徐々に失われ、症状が進行するまで初期段階では検出が困難です。 米国疾病管理予防センターによると、3,700 万人以上 (米国成人の 15%) が慢性腎臓病 (CKD) を患っていると推定されており、CKD を持つ成人の 10 人中 9 人もの人が、自分が CKD に感染していることを知りません1。 糖尿病、高血圧、心臓病、腎不全の家族歴が腎臓病の最も一般的な原因です。 現在、CKD は乳がんや前立腺がんよりも多くの死亡原因となっており、米国における死亡原因の第 9 位となっています1。
腎機能障害の程度は死亡率と心疾患のリスクの増加に関連しているため 2,3 、腎不全への進行を遅らせるには早期の正確な診断が非常に重要です 4。 血液中のクレアチニンレベルや尿中のタンパク質など、腎機能と進行リスクの現在の一般的な測定値 5,6 にはいくつかの制限があり、腎機能がより高いレベルでは正確ではありません 7。 腎生検サンプルは、糸球体硬化症や間質性線維症の程度など、さらなる予後情報を提供する可能性があります8が、それらは視覚的に推定されることが多く、解釈は病理学者によって異なる場合があります。 コンピュータ支援アルゴリズムは、より客観的な腎臓の評価を提供し、観察者間の大幅なばらつきを克服するのに役立つ可能性があります。
組織病理学的画像解析に対するいくつかの深層学習および機械学習アプローチは、スライド全体のデジタル スキャナの利用可能性が高まるにつれてますます一般的になってきています9。 クードレーら。 は、全スライド画像 (WSI) 上で畳み込みニューラル ネットワーク (CNN) を使用して、それらを肺腺癌 (LUAD)、肺扁平上皮癌 (LUSC)、または正常な肺組織に分類しました 10。 また、CNN は硬化糸球体と非硬化糸球体を分類するために WSI に適用されています 11,12。 コラチャラマら。 CNN ディープ ラーニング モデルは、分類タスク全体で病理学者が推定した線維症スコアを上回っており、ルーチンの腎生検画像にも適用できることが実証されました 13。
これまで、病理組織画像に適用されるほとんどの機械学習および深層学習アルゴリズムは、教師あり (トレーニング) アプローチに基づいていました。 ただし、教師ありアルゴリズムでは大量のラベル付きトレーニング データを使用する必要があり、時間がかかり、多くの場合非現実的で、高価な作業です。 この問題を克服するために、いくつかの研究では、比較的高いパフォーマンスをもたらす弱教師あり学習やマルチインスタンス学習 (MIL) などの方法が提案されています 14、15、16、17、18。 ただし、これらは依然として監督下での方法であり、患者レベルのラベルが必要です。