リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

大学・研究所にある論文を検索できる 「深層学習による糸球体病理画像の自動分類に関する研究 : 所見定義の標準化と腎病理診断の自動化に向けて」の論文概要。リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

コピーが完了しました

URLをコピーしました

論文の公開元へ論文の公開元へ
書き出し

深層学習による糸球体病理画像の自動分類に関する研究 : 所見定義の標準化と腎病理診断の自動化に向けて

山口, 亮平 東京大学 DOI:10.15083/0002004281

2022.06.22

概要

腎病理診断は、腎臓疾患の診断や治療方針決定に非常に重要な検査であるが、それを自動的に所見付けするなどサポートするシステムは存在しない。病理医、特に腎病理を専門とする病理医は極めて少ないと推定されていることから、機械学習などの技術を利用した診断補助システムの開発が望まれる。近年Deep Learning(深層学習)と呼ばれる人工知能関連技術が進歩し、一般画像認識では人間の精度も超える事がしばしば出ている。中でも、生物の視細胞を基に設計されたConvolutional Neural Network(以下、CNNと呼ぶ)の進歩は目覚ましく、医療分野においても、例えばレントゲン画像診断に際してCNNが放射線科医よりも良い診断精度を出したなどという報告なども出てきている。

 腎臓糸球体画像をDeep Learningによって自動所見分類しようとするには、一枚一枚の糸球体画像に対して所見とそれに対する正解ラベルが必要である。しかし腎病理疾患の診断において、全ての糸球体画像に対して全所見項目について所見を記録することは基本的に行なっておらず、代表的な糸球体について報告書を書くにとどまっている。そのため、日常診療で記録されるデータには、Deep Learningに対して正解ラベルとして使えるものが無いため、まず糸球体一個一個に対して正解ラベルをつける基準(以下、所見付け基準と呼ぶ)が必要となる。この所見付け基準の要件には、医師間で所見のばらつきが小さいこと、そして病理スライドを評価する時点では疾患が定まっていないため所見に依存しない基準であること、この二つが求められる。現在腎病理診断の分野では、IgA腎症に対するOxford分類など単一疾患に対する所見付け基準は存在するが、任意の疾患に対して医師間の一致度が確保できる所見付け基準はない。そのため、特定の疾患に限定しない所見付け基準を新たに作成すると考えられた。

 腎病理糸球体画像に対してDeep Learningによる自動所見付けを実現するため、まず腎病理に関わる医師間で所見一致度が高くなるような所見付け基準を作成することとした。デルファイ法に準じて腎病理の専門家が所見付け基準についての意見を出し合い、それを相互に参照して再び意見を出し合うという作業を通じて、所見付け基準についての意見を収束させる方法で行った。この一連のプロセスをここでは独自にMACD(Making Descriptor-Annotation- Concordance Evaluation -Discussion)サイクルと呼ぶこととした。MACDサイクルは、①Making Descriptor:病理学の成書や既存の所見分類体系、もしくは腎病理の専門家の意見を参考として所見付け基準を定義する②Annotation:共通の糸球体画像に対して、複数の専門家が所見付けを行う③Concordance Evaluation:共通の糸球体画像に対するアノテーション結果を、所見項目毎に医師間の一致度を評価する④Discussion:一致度の結果を元に、所見付け基準の内容について議論を行う、という4ステップからなる。本研究では5人の医師でMACDサイクルを2回行い、所見付け基準を作成した。所見付け基準は「Mesangial Hypercellularity(メサンギウム細胞増多)」や「Polar Vasculosis(血管極での血管増生)」といった12種類の所見項目からなり、その全てに対してスコアリング基準が定義されている。今回作成した所見付け基準に含まれる所見項目に関して、実際の糸球体画像に対して医師のつけた所見の一致度をCohenのkappa係数を用いて評価した。平均のkappa係数は所見項目によって0.28から0.50まで異なっており、腎機能に直結する所見ほど医師間の一致度が高い傾向にあった。

 次に、2回のMACDサイクルを経て作成した所見付け基準を用いて、8256枚の糸球体画像に対して、筆者が全ての所見項目に対するアノテーションを行い教師付きデータを作成した。全所見項目の中で、クラスバランスが一定以上保たれ、かつMACDサイクルの中で医師間の平均kappa係数が0.4以上ある所見項目を対象としてCNNによる学習を行なった。CNNのモデルとして、計算量と性能のバランスに優れるResidual Network(以下ResNet)を使用した。さらに一般画像認識で学習させたモデルのパラメーターを利用する転移学習を利用し、転移学習による影響も検討した。

 転移学習を行うことで、CNNの学習対象となった全ての所見項目に対して学習速度が早くなり、またほとんどの所見項目において学習精度も上昇した。ROC曲線に対してAUCが0.8を超えた所見項目は「Collapsing Obsolete(None:Segmental+Global)」「Crescent(Fibrous)」の2つであった。

 AUCが0.8を超えた所見項目である「Collapsing Obsolete(None:Segmental+Global)」 「 Crescent(Fibrous) 」 に対して、 Gradient-weighted Class Activation Mapping (GradCAM)という手法を用いて、CNNの注視点の可視化を行なった。CNNの注視点を可視化すると、CNNはこれらの2つの所見項目を判断する際に必ずしも該当する病変部位を正しく注視していないことがわかり、2つの所見項目を混同しているケースが見られた。この二つの所見項目「Collapsing Obsolete」「Crescent(Fibrous)」は同一糸球体に同時に陽性となることが多いため、画像に見られる頻度だけから強く学習する注視点を決めるCNNは、その二つの所見項目を区別できないと考えられた。糸球体画像の所見項目は、お互いに相関関係を持つものが多いため、今後は病変部位をあらかじめ領域分割などを行うなどして、画像的に分解して学習させる必要があると考えられた。

全国の大学の
卒論・修論・学位論文

一発検索!

この論文の関連論文を見る