酒井, 幸 京都大学 DOI:10.14989/doctor.k23838




第1章 グラフ畳み込みニューラルネットワークを用いた化学構造式からの親和性予測
 親和性予測モデル構築に用いる化学構造式はChEMBL(化合物の構造と受容体親和性実測値の公開データベース)より抽出した。受容体としては8種のタンパク質ファミリーに属す542種の多様な生体分子を選択した。化学構造の深層学習はグラフ畳み込みニューラルネットワーク(GCN)の手法を用いた。高精度な定量的予測モデルを得るために、GCNの隠れ層サイズを従来法である定性的予測モデルのそれと比べて9-32倍拡大し、複数モデルのアンサンブル使用により予測性能の向上を達成した。予測性能の目安となる平均絶対誤差値(pIC50の実測値と予測値の差)は542種中395種(73%)で0.6以下、521種(96%)で0.7以下であった。予測モデルの妥当性は2種類の方法で検証した。まず画像認識等で頻用される畳み込み計算手法による親和性予測モデルと比較したところ、従来法の二乗平均平方誤差が0.68であるのに対して、提案手法は0.49とより高精度での予測が可能であった。次に抗うつ薬の作用点であるセロトニントランスポータ(SERT)に対する作用がまだ調べられていない化合物をChEMBLから抽出してSERT阻害活性を予測した。阻害活性予測値(IC50)が10nMであったCHEMBL1377753の合成品を入手してSERT発現細胞での阻害活性を実測したところIC50は6.24nMで予測に近似しており、既存抗うつ薬と同程度の強さであった。また当該化合物のin vivo作用を代表的な抗うつ薬評価系であるマウス尾懸垂試験で実測したところ、有意な抗うつ作用が認められた。以上より、多様な生体分子に対して高い精度と予測妥当性を併せ持つ親和性予測モデルの構築に成功した。

第2章 受容体親和性予測値を用いた有害事象および原因標的タンパク質の予測
 近年、市販後に明らかになった有害事象(Adverse Event, AE)ビッグデータの解析により、AEの発現に対する多剤併用の影響や、併用時のAE低減傾向に着目した新規創薬標的の提案が報告されている。しかし薬理活性に基づくAE予測の研究例は数少ない。本研究では、AE発現前に使用していた全ての医薬品がそAEに関与しえると仮定し、全医薬品成分の542種の受容体に対する親和性予測値とAE報告数との関係性に基づくAE発症予測を試みることで、AEの発生原因となりえる受容体を明らかにしようとした。我が国の医薬品副作用報告データを用いてSMQと呼ばれる166種のAEグループに対して予測モデルを構築したところ、AE報告数が100件以上存在する98種のSMQのうち72種(74%)において予測モデルのAUC(予測性能指標)が0.7以上の精度で予測が可能となった。これによってトルサード・ド・ポアント/QT延長不整脈に対するhERGK+チャネルや内皮型一酸化窒素合成酵素など、AE発症への関与が疑われる標的タンパク質が69種(70%)のSMQにおいて浮かび上がった。関与が疑われる標的タンパク質としての報告の少ない生体分子も数多く含まれていた。また、動物による検証が不可能な、例えば自殺・自傷関連有害事象についても関連が疑われる新規標的タンパク質の存在が示唆された。




