Three-dimensional convolutional autoencoder extracts features of structural brain images with a “diagnostic label-free” approach: Application to schizophrenia datasets
概要
1. 序論
深層学習は,画像認識など様々な分野の技術を飛躍的に向上させている(LeCun, Bengio and Hinton, 2015).精神疾患脳画像研究においても,深層学習は大いに期待されている (Durstewitz, Koppe and Meyer-Lindenberg, 2019).しかし,深層学習を使った精神疾患脳画像研究には,(1)データが超高次元のため取り扱いが容易でない,(2)精神疾患の遺伝的・臨床的異質性のために一貫した知見が得られにくい(Feczko et al., 2019)という困難がある.例えば,磁気共鳴画像(Magnetic Resonance Imaging: MRI)のオリジナルのデータは数百万次元という超高次元であり,ほとんどの脳画像研究では,特徴量抽出法を使用することで扱うデータ量を減らす工夫がなされている.最も一般的な特徴量抽出法の 1 つは関心領域(Region of interest: ROI)法である.ROI は,これまでの神経科学の知見に基づいて設定され(Collins et al., 1994; Tzourio-Mazoyer et al., 2002),数十から数百次元の特徴量として抽出される.しかし,これらの研究は,元の MRI 画像に含まれる 3 次元空間情報を無視してしまっており,重要な情報を欠落させている懸念がある.異質性は,現在の精神医学研究が直面している主な課題の 1 つである(Feczko et al., 2019).現在の診断基準は,遺伝的・臨床的な異質性により,予後予測について妥当性を欠いていることが指摘されている.例えば,統合失調症,双極性障害,うつ病において共通の遺伝子変異が多数報告され,疾患内での遺伝的相関が低い可能性もある(Lee et al., 2014).また,同じ統合失調症と診断された患者でも,症状の重症度,薬物感受性,予後は患者によって大きく異なることが多い(Owen, Sawa and Mortensen, 2016).そのため,現在の疾患カテゴリーに基づいて単純に判別精度を競うだけでは,病態の解明や治療の向上には不十分である可能性がある.
本研究の目的は,上述の問題を克服するため,精神疾患脳画像の,深層学習を用いた特徴量抽出法を検討することである.本研究のポイントは(1)空間情報を保持したまま 3 次元MRI データを利用すること,(2)3 次元畳み込みオートエンコーダー(Three dimensional- Convolutional auto encoder: 3D-CAE)を用いた診断名のラベルを学習に使わない(診断ラベルフリーの)特徴量抽出であること,である.さらに,3D-CAE の適切なネットワーク構造を探索し,抽出された特徴量による臨床情報の予測性能を比較した.
2. 実験材料と方法
京都大学で収集した脳構造 MRI 画像(統合失調症患者 82 人,健常者 90 人)を使用して 3D-CAE を学習させ,Center for Biomedical Research Excellence(COBRE: 統合失調症患者 71人,健常者 71 人)データセット (http://fcon_1000.projects.nitrc.org/indi/retro/cobre.html)で評価した.入力データは,前処理として,脳構造 MRI から灰白質のみを抽出したものとした.深層学習モデルでは,ネットワーク構造を制御する変数,すなわちハイパーパラメーターを設定する必要がある.本研究では,抽出された特徴量のサイズと有効受容野の大きさが,特徴量と臨床情報との関連性に影響を与えるかどうかを調べるために,畳み込み層の数とチャンネル数の 2 つのハイパーパラメーターを探索した.具体的には,2 つの畳み込み層と 1つのプーリング層を 1 ブロックとし,ブロック数は 1,2,3,4 に設定した.チャンネル数は,1,4,16,32 チャンネルと設定し,合計 16 のモデルについて再構成誤差を比較した.さらに,抽出された特徴量で臨床情報を線形回帰することで,特徴量が臨床情報を保持しているかどうかを評価した.
3. 結果
3D-CAE は過学習することなく学習でき,再構成誤差が十分に小さくなった.また,COBRE データセットでも同様の傾向を示した.このことから,提案した 3D-CAE は,スキャンパラメーターの異なる別の施設の MRI 画像データにも適用できることがわかった.
回帰分析の結果,統合失調症に関連する臨床情報,具体的にはクロルプロマジン換算値(CPZ 換算値),陽性症状スコア,発症年齢,診断を予測する場合,チャンネル数にかかわらず,3 ブロックの 3D-CAE モデルが優れた予測性能を示した.また,これらの臨床情報の予測において,3 ブロックの 3D-CAE は ROI 法よりも優れていた.一方,年齢や知能など,統合失調症とは直接関係のない情報については,チャンネル数にかかわらず,1 ブロックの 3D-CAE モデルが優れた予測結果を示した.しかし,1 ブロックの 3D-CAE は,これらの情報を予測する上で,ROI 法よりも優れた結果は得られなかった.
4. 考察
本研究では,(1)提案した 3D-CAE は,3 次元脳構造 MRI データを十分に低い誤差で再構成することに成功し,(2)3D-CAE を用いて診断ラベルフリーで抽出した特徴量は,様々な臨床情報との関連性を保持していることが明らかになった.また,3 ブロックの 3D-CAEモデルにより抽出できる特徴量では,統合失調症患者の抗精神病薬の投薬量や陽性症状に関連する情報を保持できる可能性があることが示唆された.今回の手法は,診断ラベルフリーで個人の脳画像の特徴を保持した特徴量を抽出することができ,異質性を持つ集団に対しては有効な手法であると考えられる.現行の診断基準に基づく診断ラベルを用いない特徴量抽出は,科学的にも意義があり,本研究は深層学習を用いたデータ駆動型の代替診断基準の開発につながる可能性がある.