Cellular APOBEC3A deaminase drives mutations in the SARS-CoV-2 genome
概要
主論文の要旨
Cellular APOBEC3A deaminase drives mutations in
the SARS-CoV-2 genome
APOBEC3AがSARS-CoV-2ゲノムへ変異を導入する
名古屋大学大学院医学系研究科
免疫不全統御学講座
総合医学専攻
免疫不全統御学分野
(指導:岩谷 靖雅
中田 佳宏
教授)
【緒言】
新 型 コ ロ ナ ウ イ ル ス 感 染 症 (COVID-19: coronavirus diseases 2019) の 原 因 で あ る
SARS-CoV-2(Severe acute respiratory syndrome coronavirus 2)は 2019 年末に中国武漢市
で初めて感染者が見つかり、その後急速に全世界へ感染が拡大した。SARS-CoV-2 は
ウイルスがコードする nsp14(non-structural protein 14)がもつ exoribonuclease 活性によ
って他の RNA ウイルスと比較してゲノムの変異率を低く保っている。しかし、感染
伝播の過程で徐々にゲノム配列に変異が蓄積し、新たなバリアントが出現している。
一方、SARS-CoV-2 の感染拡大初期(2020 年の前半)のウイルスゲノム配列を用いた
分子疫学的研究により、シトシン(C)からウラシル(U)への変異(C>U 変異)が他の変
異と比べ多く生じていることが報告された。C>U 変異箇所の配列の特徴から、ウイ
ルスゲノムへの変異導入にシチジン脱アミノ化酵素群である APOBEC ファミリータ
ンパク質(以下 APOBEC)が関与しているのではないかと予想された。しかし、直接的
なウイルス学的検証はいまだなされておらず、APOBEC が SARS-CoV-2 ゲノム RNA
へ変異導入できるか否かについては不明のままであった。そこで本研究では、SARSCoV-2 ゲノムの変異に対する各種 APOBEC の影響を明らかにすることを目的に実験
的検証を行った。
【方法】
2022 年 7 月 24 日に GISAID(Global Initiative on Sharing All Influenza Data)EpiCoV
database から取得した SARS-CoV-2 のゲノム全長配列(>29,000 塩基[nt])から、同じ遺
伝子型が 2 本以上登録され、伝播していることが確からしい 2,051,393 配列を抽出し
た。加えて EpiCoV より、それら配列の検体採取日等のメタデータもあわせて取得し
た。これら配列を Wuhan 株の参照配列と比較し、変異の種類と座位数を解析した。
試験管内での APOBEC の影響を解析するために、ヒト Angiotensin-converting enzyme
2(ACE2)及び Transmembrane protease, serine 2(TMPRSS2)が恒常的に発現したヒト胎
児腎細胞由来 293T(293AT)細胞に、7 種の APOBEC3(A3)および、Activation-Induced
Deaminase(AID)、APOBEC1(A1)をそれぞれトランスフェクション法により導入した。
過剰発現させた後、SARS-CoV-2 を感染させた。24 時間後にウイルスを回収し、ウイ
ルスゲノム RNA 配列を Illumina MiSeq(Next generation sequencing: NGS)により解析し
た。誘導されたサンプル内存在頻度の変異を検出した。既報の情報から、1%の頻度を
閾値とした。次に、SARS-CoV-2 の感染の標的となる気道、鼻腔ならびに肺由来の上皮
系培養細胞および初代培養細胞に対して各種サイトカインによって刺激した際の A3
の mRNA 発現量を reverse transcription-droplet digital PCR(RT-ddPCR)法により定量
した。内在性の A3 によるウイルスのゲノム配列への影響については、ウイルス感染
前及び感染後に A3 を誘導し、産生されたウイルスのゲノム配列を NGS により解析し
た。さらに、CRISPR/Cas9 によるゲノム編集で樹立した A3 Knock Out(KO)細胞につい
ても親株と同様の解析を行い、両者を比較した。
-1-
【結果】
2019 年 12 月末から 2022 年 6 月末までの 2.5 年間に採取された検体の SARS-CoV-2
ゲノム RNA 配列を EpiCoV より取得し、それらを対象にバイオインフォマティクスに
よる変異解析を実施した。検体採取日と変異数の回帰線から、変異は総じて 26.9 nt per
year(nt/yr)で蓄積してきたことが示された。変異の中でも、APOBEC の関与が想定さ
れる C>U 変異は 10.2 nt/yr であり、他の変異と比較して、3.3 倍以上多くかつ断続的に
蓄積していたことが確認された(Figure 1)。このことから、APOBEC のいずれかが繰り
返し SARS-CoV-2 ゲノム RNA に変異を導入してきた可能性が示唆された。
次に、各種 APOBEC を過剰発現させた 293AT 細胞に、SARS-CoV-2 を感染させ、ウ
イルスゲノム RNA に特徴的な C>U 変異が上昇するのかを実験的に検証した。解析し
た APOBEC の中で、A3A を発現した 293AT から産生された SARS-CoV-2 のゲノム配
列のみに APOBEC3 signature である C>U 変異が有意に多く認められた(Figure 2A)。
一方、酵素活性欠失型である A3A E72Q および AID、A1 ならびに他の A3 ファミリー
を発現した 293AT から産生されたウイルスでは C>U 変異の蓄積は認められなかっ
た。これらの結果から、A3A により SARS-CoV-2 ゲノム RNA に変異が導入されるこ
とが示唆された。また、293AT 細胞に A3A を過剰発現させた際に認めたウイルスゲノ
ム RNA 中の C>U 変異のホットスポットが RNA の二次構造上に特徴ある分布をして
いるのか解析した。既報で selective 2’-hydroxyl acylation analysed by primer extension
(SHAPE)法によって決定された SARS-CoV-2 の RNA の二次構造情報にマップした結
果 、 hairpin loop あ る い は bulge と い っ た 一 本 鎖 領 域 の ウ ラ シ ル ・ シ ト シ ン (UC)
dinucleotide 配列にホットスポットがあることがわかった(Figure 2B)。これらホットス
ポットの特徴は、A3A が好んで DNA に変異導入する signature と同じであり、A3A が
RNA でも DNA と同様の signature を好んで変異導入することが示唆された。
ここで、インターフェロン誘導遺伝子(Interferon [IFN] stimulated genes; ISGs)のひと
つである A3A が呼吸器系上皮細胞で発現しているかを調べた。Calu-3 をはじめとする
各種呼吸器系の上皮細胞株や初代培養細胞に対して、I 型 IFN である IFN-β と腫瘍壊
死因子(Tumor Necrosis Factor-α: TNF-α)によって同時刺激すると A3A の mRNA 発現レ
ベルが約 30〜1,120 倍上昇し、低酸素環境下ではさらに相加的な発現レベルの上昇効
果が認められた(Figure 3)。このことから、呼吸器系の細胞において、ウイルス感染時
などの IFN 誘導時に A3A が存在しうることが示唆された。さらに、Calu-3 細胞の内
在性の A3A によって C>U 変異が誘導されるかを調べた。IFN-β+TNF-α で刺激した
Calu-3 細胞に SARS-CoV-2 を感染させ、産生されたウイルスのゲノム配列を観察した。
その結果、C>U 変異の蓄積が認められたが、ウイルス感染後に IFN-β+TNF-α で刺激
した場合では C>U 変異の蓄積は認められなかった(Figure 4A)。さらに、A3A KO Calu-3
細胞ではウイルス感染前に IFN-β+TNF-α で刺激しても、親株で認められた C>U 変異
の蓄積は観察されなかった(Figure 4B)。これらのことから、呼吸器系組織において
A3A が誘導され、感染した SARS-CoV-2 のゲノム RNA に C>U 変異が蓄積しうること
が示唆された。
-2-
【考察】
SARS-CoV-2 の感染拡大初期の分子疫学的配列解析から C>U という特徴的な変異
の蓄積が認められるという報告により APOBEC ファミリータンパク質の関与が予想
されていた。しかし、直接的なウイルス学的検証はされていなかった。本研究では、
(1)2022 年に至っても、断続的な C>U 変異の蓄積がウイルスゲノム RNA に生じてい
ること、(2)APOBEC の中でも、A3A が SARS-CoV-2 ゲノム RNA に対して特に強い
C>U 変異導入能があり、hairpin loop 上の UC>UU が好んで生じること、(3)I 型 IFN な
どの炎症系の刺激により、呼吸器系上皮細胞にて A3A が誘導され、誘導後に感染した
SARS-CoV-2 のゲノム RNA に C>U 変異を導入できること、を明らかにした。
A3A を過剰発現させた 293AT 細胞において認めた C>U 変異のパターンと、SARSCoV-2 の分子疫学的配列情報で観察された各 C>U 変異の頻度は完全に一致するもの
ではなかった。この不一致に関しては、宿主における免疫や伝播の過程の中での選択
が、おそらく深く関わっているものと考えられる。
【結語】
本研究によって、呼吸器系上皮細胞では炎症系の刺激により A3A が誘導され、宿主
由来の A3A による RNA editing により SARS-CoV-2 ゲノムの C>U 変異が増加し、
SARS-CoV-2 の遺伝的多様性の拡大に寄与していることが明らかとなった。
-3-
Figure 1. Chronological nucleotide changes observed in SARS-CoV-2 genome sequences in the GISAID database.
Chronological changes in the numbers of mononucleotide substitutions per genome were analysed for each SARSCoV-2 sequence (n = 2,051,393) relative to the Wuhan reference strain. The number was plotted against the sample
collection date corresponding to the sequence in the GISAID database. The red lines represent linear regression lines.
The years “0”, “1” and “2” on the x-axis represent 2020, 2021 and 2022, respectively.
-4-
Figure 2. Exogenous A3A expression induces C-to-U mutations in the SARS-CoV-2 viral RNA (vRNA) genome,
preferentially in single-stranded RNA (ssRNA) regions. (A) The number of positions with C-to-U substitutions in the
viral genome was determined. AID, A3 (A-G, or H haplotype II [hapII]), A1 and A1 E63A proteins were transiently
expressed in 293AT cells. Empty vector (Vector) was used as the negative control for the absence of deaminase
expression. Thirty-six hours after transfection, the cells were infected with SARS-CoV-2 (B.1.1) (MOI = 0.5) and
incubated for another 24 h. Viral genomes were sequenced on the Illumina MiSeq system. The graph shows the number
of positions with C-to-U mutations in the dinucleotide context (UC-to-UU, VC-to-VU (V= not U), and others), with a
prevalence of ≥1.0% throughout the viral genome. The data are representative of three independent experiments. (B)
The prevalence of mutations detected at each position in the viral genome is indicated in two bar graphs, along with a
schematic diagram of the viral genomic structure. The upper and lower graphs represent the mutation prevalence (%)
in the viruses produced from 293AT cells transfected with empty vector (Vector) or the A3A plasmid (A3A),
respectively. The ten major positions of A3A-induced editing are labelled I-X. Secondary RNA structures around the
edited positions (red arrows) were extracted from the results of a previous SHAPE study and are drawn in this figure.
-5-
Figure 3. A3A mRNA expression in human airway and lung cells. The A3A mRNA level in each cell line was
quantified by RT–ddPCR 18 h after treatment without (control) or with IFN-ß and/or TNF-α under normoxic conditions
(N). A549, Calu-3, SAE, AT2, and LBE cells and HNEpCs were also cultured under hypoxic conditions (H). The mean
mRNA copy numbers of A3A relative to those of the housekeeping gene RPP40 are shown (n=3).
Figure 4. A3A expression induced by IFN-ß and TNF-α in Calu-3 cells increases UC-to-UU mutations in the SARSCoV-2 genome. (A and B) Effects of IFN-ß and TNF-α treatment on C-to-U mutations in the SARS-CoV-2 genome
were analysed using Calu-3 cells and A3A-KO Calu-3 cells (clone #15). The cells were left untreated (control) or
pretreated (Pretreated) with IFN-ß and TNF-α. Seventy-two hours post-infection with SARS-CoV-2 (B.1.1), the culture
supernatants were harvested. The infected cells were treated with IFN-ß and TNF-α (Posttreated), and the supernatants
were collected. The position and prevalence of the mutations in the genome at passage (P1) were analysed and are
shown in bar graphs. The closed circles indicate mutations with a prevalence of ≥1%.
-6-