リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

大学・研究所にある論文を検索できる 「ゲノミック予測を用いた育種の効率化・最適化に関する理論的研究」の論文概要。リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

コピーが完了しました

URLをコピーしました

論文の公開元へ論文の公開元へ
書き出し

ゲノミック予測を用いた育種の効率化・最適化に関する理論的研究

田中, 凌慧 東京大学 DOI:10.15083/0002002049

2021.10.04

概要

2050年までに地球の人口は90億人を突破すると試算されており、持続可能な食料供給を実現するには育種を加速する技術の開発は不可欠である。ゲノミック予測とは、ゲノムワイドマーカー遺伝子型をもとに表現型値を予測することをいい、この予測値をもとに選抜を行ことをゲノミック選抜という。ゲノミック選抜は、育種において大きなコストを要している表現型評価を、予測モデルを用いて大幅に省略でき、育種の効率化に貢献する重要技術と考えられている。本研究では、ゲノミック予測を用いた育種の効率化・最適化を目的とした新規手法の開発・予測モデルの評価を行なった。

1. 能動学習に基づくゲノミック予測モデルの効率的構築
 ゲノミック選抜は、ある系統を選抜するか淘汰するかの二値分類問題として捉えることもできる。このとき、予測モデルの分類精度は選抜効率に直結する重要な因子であり、できる限り高い分類精度を実現する予測モデルを構築することが望ましい。一般に、ゲノミック予測の精度は、モデル構築に用いる系統に依存することが知られており、同じ系統数でも、どの系統を用いるかを適切に選択することで、高精度な予測モデルを構築できると考えられる。無作為抽出された訓練データを受動的に用いて予測モデルを学習するのではなく、既存のデータと予測モデルを踏まえて能動的に訓練データを選択し学習する方法は能動学習とよばれ、機械学習の分野を中心に開発が進み、創薬等の分野では既に実用化されている。能動学習は幅広い研究分野でその有効性が確かめられているが、ゲノミック予測で扱う高次元かつノイズの大きいデータでも機能するかは未知数であった。

 そこで、本研究では、能動学習をゲノミック予測に応用することで、予測精度を効率よく向上できるかをシミュレーションを用いて検証した。遺伝子型の選抜・淘汰を分類問題としてあつかい、サポートベクトルマシンを用いて分類モデルを構築した。能動学習には、最も標準的なアルゴリズムuncertainty samplingを採用した。4つの実データセットを用いて検証した結果、延べ22形質のうち17形質で能動学習により有意に分類精度が向上し、3形質で低下した。以上の結果から、能動学習がゲノミック予測の訓練データ選択法として有用であることが示された。

2. ベイズ最適化に基づく優良系統の効率的発見
 遺伝資源の持つ多様な有用変異を活用することは育種における重要課題である。しかし、現状では、遺伝資源の利用はコア・コレクションに含まれるごく一部の系統に限られている。ゲノミック予測を用いれば、一部の系統の表現型とマーカー遺伝子型から構築された予測モデルをもとに、マーカー遺伝子型が取得された全ての系統について遺伝子型値を予測できる。一部系統の表現型評価-モデル更新-未試験系統の選抜、というサイクルを繰り返すことで、マーカー遺伝子型をもつ全ての遺伝資源系統を対象に、有用系統の探索を行うことができる。

 本研究では、ゲノミック予測を用いた優良遺伝資源系統の探索をblack-box最適化の枠組みで定式化するとともに、ベイズ最適化とよばれる最適化アルゴリズムに基づき、期待改善量という新たな選抜基準をもとに選抜を行う方法を提案した。期待改善量は予測モデルの不確実性を考慮した選抜基準であり、不確実性が高い、すなわち、非常に劣った系統である可能性もあるが、既存の系統よりも優れた系統である可能性も高い系統を優先的に選ぶ戦略を与える。実データを用いたシミュレーションによる検証の結果、期待改善量に基づく選抜戦略は、通常のゲノミック予測で行われる選抜戦略に比べて、平均で30%ほど少ない試験系統数で、遺伝資源内の優良系統を発見できた。通常の選抜戦略は、単純に予測値の大きな系統から順に選抜するが、その場合、一部の系統だけで構築された予測モデルを盲信してしまう。期待改善量に基づく選抜戦略は、不確実性を考慮することにより、予測モデルの誤りを適宜修正しつつ、既存の系統を上回る系統を選抜できると考えられた。この結果から、期待改善量に基づく選抜戦略により、ゲノミック予測を用いた優良遺伝資源系統の探索をさらに加速できると期待される。

3. ゲノミック予測における多環境試験デザインの最適化
 多環境試験は、遺伝子型と環境の交互作用(GxE; genotype-by-environment interaction)に関する情報を得るために必須である。しかし、多数の系統を用いた大規模な多環境試験を行うには大きな金銭的・労力的に大きなコストが必要であり、通常は、主要な系統に絞って多環境試験を実施し、それらの系統についてのみGxEを評価する。しかし、ゲノミック予測を多環境の表現型データに拡張する(多環境ゲノミック予測)ことで、一部の表現型データをもとに、試験しなかった表現型を補完することも可能である。つまり、ゲノム情報によって系統間の類似性が定義されていれば、必ずしも一部の系統を選んで多環境試験を行う必要はなく、それぞれの環境で異なる系統を試験しても、GxEに関する知見を得ることができる。

 この場合にも、能動学習により試験するべき系統を選んだ場合と同様に、各環境で試験すべき系統を適切に選ぶことにより、得られる予測モデルの精度が向上する可能性がある。本研究では、ゲノミック予測のモデル構築のためにどの系統を用いるか、という訓練集団の最適化のために提案された予測誤差分散(PEV; prediction error variance)および決定係数(CD; coefficient of determination)を多環境におけるゲノミック予測にも拡張し、どの系統をどこで試験すべきか、という多環境試験のデザインの最適化に用いた。PEVやCDを多環境試験のデザインの最適化に用いる場合には、遺伝子型値の環境間相関や、対象形質の遺伝率を超パラメータとして事前に設定する必要がある。本研究では、この超パラメータの設定が、PEVやCDによって得られる多環境試験のデザインを大きく左右することを明らかにした。例えば、環境間相関が低い場合には、すべての候補系統を満遍なく試験するようなデザインが選ばれ、逆に、環境間相関が高い場合には、一部の代表的な系統を複数の環境で試験するようなデザインが選ばれた。また、多環境試験のデザインをPEVやCDによって最適化する場合には、これら超パラメータを妥当な値に設定する必要があることを明らかにした。例えば、表現型値にGxEの影響がほとんどなく表現型値の環境間相関が0.9を超えるような場合に、環境間相関を0.25と設定してしまうと、PEVやCDを用いることにより、予測精度が逆に悪化した。しかし、真の状態と大きく異なる設定をしない限り、PEVやCDによる最適多環境試験デザインを用いて予測精度を改善できることがわかった。

4. ゲノミック予測に基づく交配後代の分離予測に関するシミュレーション研究
 ゲノミック予測は、ある個体の持つマーカー遺伝子型をもとに、その個体の遺伝子型値を予測する手法である。そして、個体や系統を、表現型値ではなく予測値をもとに選抜するのが基本的な利用法である。しかし、両親のマーカー遺伝子型とマーカー間の組換え価が与えられれば、その後代個体のマーカー遺伝子型をシミュレーションによって生成できる。こうして生成される仮想のマーカー遺伝子型にゲノミック予測を適用すれば、後代個体のもつ遺伝子型値の平均値や分散の予測値を得ることができる。これら予測値は育種家が交配組合せを選定する際に有益な情報となる。

 後代の分離予測はゲノミック予測の重要な活用手段であるにも関わらず、分離予測の精度(つまり、後代遺伝子型値の平均値や分散の予測精度)については十分な検討がなされてこなかった。本研究では、ベイズリッジ回帰(BRR;Bayesian ridge regression)およびBayesAとよばれる2つの代表的な予測モデルについて、後代分離の予測精度に注目したモデル比較を行なった。

 まず、数少ない先行研究のほとんどが、後代分散を厳密に正確な方法で計算していないことを明らかにした。具体的には、訓練データから構築された予測モデルには常に不確実性がともなうため、後代遺伝子型値の分散を予測する場合には、その不確実性を考慮しなければならない。考慮しない場合には、後代分散が大きく過小予測される可能性があることを理論式の導出により明らかにした。さらに、BRRとBayesAが、後代平均の予測についてはほとんど同程度の予測精度を与えるにも関わらず、後代分散の予測については、BayesAのほうがはるかに優れた予測精度を与えることを明らかにした。BRRによって予測された後代分散は、ほとんどの交配組み合わせで似通った値を示す縮小予測になる傾向が、BayesAに比べて強く見られた。すなわち、交配組み合わせ間で後代遺伝子型値の分散の大小を予測・比較したい場合には、BayesAを使用することが強く推奨される。BayesAに類似するBayesBが、別の観点からも、交配による世代の変化に頑健な予測ができることが先行研究で示されており、本研究の結果と合わせて、BRRに対するBayesAの優位性が示された。

 ゲノミック予測は、育種家によりともすると主観的に行われる育種を客観化するための強力な道具であり、本研究で扱った能動学習やベイズ最適化は、その道具を合理的に運用するための手法である。本研究で提案した手法により、いくつかの単純化された条件のもとでは、ゲノミック予測の優れた運用法が与えられることがわかった。しかし、実際の植物育種は非常に複雑であり、本研究はそのごく一部を切り取って最適化したものにすぎない。持続的な食料供給の実現に向けて、本研究のようなアプローチをもとにした育種のモデル化と最適化を、さらに推し進めることが望まれる。

この論文で使われている画像

参考文献

Akbani, R., S. Kwek and N. Japkowicz. 2004. Applying support vector machines to imbalanced datasets. In: European conference on machine learning (pp. 39–50). Springer, Berlin, Heidelberg. Akdemir, D. and J.I. Sánchez. 2016. Efficient breeding by genomic mating. Front. Genet. 7: 210.

Akdemir, D., J.I. Sanchez and J.L. Jannink. 2015. Optimization of genomic selection training populations with a genetic algorithm. Genet. Sel. Evol. 47: 38.

Akdemir, D., W. Beavis, R. Fritsche-Neto, A.K. Singh and J. Isidro-Sánchez. 2018. Multi-objective optimized breeding strategies for sustainable food improvement. Heredity. doi: 10.1038/s41437- 018-0147-1.

Araus, J.L. and J.E. Cairns. 2014. Field high-throughput phenotyping: the new crop breeding frontier. Trends Plant Sci. 19: 52–61.

Asoro, F.G., M.A. Newell, W.D. Beavis, M.P. Scott and J.L. Jannink. 2011. Accuracy and Training Population Design for Genomic Selection on Quantitative Traits in Elite North American Oats. Plant Genome. 4: 132–144.

Auer, P., N. Cesa-Bianchi and P. Fischer. 2002. Finite-time analysis of the multiarmed bandit problem. Mach. Learn. 47: 235–256.

Avendaño, S., J.A. Woolliams and B. Villanueva. 2004. Mendelian sampling terms as a selective advantage in optimum breeding schemes with restrictions on the rate of inbreeding. Genet. Res. (Camb.) 83: 55–64.

Bari, A., K. Street, M. Mackay, D.T.F. Endresen, E.D. Pauw and A. Amri. 2012. Focused identification of germplasm strategy (FIGS) detects wheat stem rust resistance linked to environmental variables. Genet. Resour. Crop Evol. 59: 1465–1481.

Bishop, C.M. 2006. Pattern Recognition and Machine Learning. Springer.

Blagus, R. and L. Lusa. 2010. Class prediction for high-dimensional class-imbalanced data. BMC Bioinformatics. 11: 523.

Breiman, L. 2001. Random Forests. Mach. Lern. 45: 5–32.

Broman, K.L., H. Wu, S. Sen and G.A. Chrchill. 2003. R/qtl: QTL mapping in experimental crosses. Bioinfomatics. 19: 889–890.

Brown, J. and P. Calligari. 2008. An introduction to plant breeding. Oxford: Blackwell Publishing.

Browning, S.R. and B.L. Browning. 2007. Rapid and accurate haplotype phasing and missing-data inference for whole-genome association studies by use of localized haplotype clustering. Am. J. Hum. Genet. 81: 1084–1097.

Burgueño, J., G. de los Campos, K. Weigel and J. Crossa. 2012. Genomic prediction of breeding values when modeling genotype × environment interaction using pedigree and dense molecular markers. Crop Sci. 52: 707–719.

Byrne, P.F., G.M. Volk, C. Gardner, M.A. Gore, P.W. Simon and S. Smith. 2018. Sustaining the future of plant breeding: the critical role of the USDA-ARS national plant germplasm system. Crop Sci. 58: 451–468.

Chaloner, K. and I. Verdinelli. 1995. Bayesian experimental design: a review. Stat. Sci. 10: 273–304.

Chang, C.C. and C.J. Lin. 2011. LIBSVM: a library for support vector machines. ACM Trans. Intell. Syst. Technol. 2: 27.

Chang, H.X., P.J. Brown, A.E. Lipka, L.L. Domier and G.L. Hartman. 2016. Genome-wide association and genomic prediction identifies associated loci and predicts the sensitivity of Tobacco ringspot virus in soybean plant introductions. BMC Genom. 17: 153.

Chapelle, O. and L. Li. 2011. An empirical evaluation of Thompson sampling. Adv. Neural. Inf. Process. Syst. pp.2249-2257.

Chen, T. and C. Guestrin. 2016. Xgboost: a scalable tree boosting system. In: Proceedings of the 22nd ACM SIGKDD International conference on knowledge discovery and data mining.

Cohen, J. 1960. A coefficient of agreement for nominal scales. Educ. Psychol. Meas. 20: 37–46. Cortes, C. and V. Vapnik. 1995. Support-vector networks. Mach. Learn. 20: 273–297.

Crossa J., Y. Beyene, S. Kassa, P. Pérez, J.M. Hickey, C. Chen, G. de los Campos, J. Burgueño, V.S. Windhausen, E. Buckler, J.L. Jannink, M.A.L. Cruz and R. Babu. 2013. Genomic prediction in maize breeding populations with genotypeing-by-sequencing. G3 (Bethesda). 3: 1903–1926.

Crossa, J., G. de los Campos, P. Perez, D. Gianola, J. Burgueño, J.L. Araus, D. Makumbi, R.P. Singh, S. Dreisigacker, J. Yan, V. Arief, M. Banziger and H.J. Braun. 2010. Prediction of genetic values of quantitative traits in plant breeding using pedigree and molecular markers. Genetics 186: 713–724.

Crossa, J., P. Pérez-Rodríguez, J. Cuevas, O. Montesinos-López, D. Jarquín, G. de los Campos, J. Burgueño, J.M. González-Camacho, S. Pérez-Elizalde, Y. Beyene, S. Dreisigacker, R. Singh, X. Zhang, M. Gowda, M. Roorkiwal, J. Rutkoski and R.K. Varshney. 2017. Genomic selection in plant breeding: methods, models and perspectives. Trends Plant Sci. 22: 961–975.

Daetwyler, H.D., M.J. Hayden, G.C. Spangenberg and B.J. Hayes. 2015. Selection on optimal haploid value increases genetic gain and preserves more genetic diversity relative to genomic selection. Genetics. 200: 1341–1348.

de los Campos, G. and A. Grüneberg. 2014. MTM pakage: Fits a (Bayesian) Multivariate Gaussian Mixed Effects Model using a Gibbs Sampler. URL: http://quantgen.github.io/MTM/vignette.html (accessed November 26, 2018).

de los Campos, G., A.I. Vazquez, R. Fernando, Y.C. Klimentidis and D. Sorensen. 2013a. Prediction of Complex Human Traits Using the Genomic Best Linear Unbiased Predictor. PLoS Genet. 9: e1003608

de los Campos, G., J.M. Hickey, R. Pong-Wong, H.D. Daetwyler and M.P.L. Calus. 2013b. Whole-genome regression and prediction methods applied to plant and animal breeding. Genetics. 193: 327–345.

Desta, Z.A. and R. Ortiz. 2014. Genomic selection: genome-wide prediction in plant improvement. Trends Plant Sci. 19: 592–601.

Endelman, J.B. and J.L. Jannink. 2013. Shrinkage estimation of the realized relationship matrix. G3 (Bethesda). 2: 1405–1413.

Falconer, D.S. and T.F.C. Mackay. 1996. Introduction to Quantitative Genetics. 4th edn, Longman Group, London.

Gao, N., J.W.R. Martini, Z. Zhang, X. Yuan, H. Zhang, H. Simianer and J. Li. 2017. Incorporating gene annotation into genomic prediction of complex phenotypes. Genetics. 207: 489–501.

García-Ruiz, A., J.B. Cole, P.M. VanRaden, G.R. Wiggans, F.J. Ruiz-López and C.P.V. Tassell. 2016. Changes in genetic selection differentials and generation intervals in US Holstein dairy cattle as a result of genomic selection. Proc. Natl. Acad. Sci. U.S.A. 113: E3995–4004.

Gianola, D. 2013. Priors in whole-genome regression: the Bayesian alphabet returns. Genetics. 194: 573– 596.

Gianola, D., G. de los Campos, W.G. Hill, E. Mandredi and R. Fernando. 2009. Additive genetic variability and the Bayesian alphabet. Genetics. 183: 347–363.

Gianola, D., R. Fernando and A. Stella. 2006. Genomic-assisted prediction of genetic value with semiparametric procedures. Genetics. 173: 1761–1776.

González-Recio, O. and S. Forni. 2011. Genome-wide prediction of discrete traits using Bayesian regressions and machine learning. Genet. Sel. Evol. 43: 7.

Gorjanc, G., J. Jenko, S.J. Hearne and J.M. Hickey. 2016. Initiating maize pre-breeding programs using genomic selection to harness polygenic variation from landrace populations. BMC Genom. 17: 30.

Grattapaglia, D., O.B. Silva-Junior, R.T. Resende, E.P. Cappa, B.S.F. Muller, B. Tan, F. Isik, B. Ratcliffe and Y.A. El-Kassaby. 2018. Quantitative genetics and genomics converge to accelerate forest tree breeding. Front. in Plant Sci. 9: 1963.

Habier, D., R.L. Fernando and J.C.M. Dekkers. 2007. The impact of genetic relationship information on genome-assisted breeding values. Genetics. 177: 2389–2397.

Habier, D., R.L. Fernando and J.C.M. Dekkers. 2013. Genomic BLUP decoded: a look into the black box of genomic prediction. Genetics. 194: 597–607.

Han, Y., J.N. Cameron, L. Wang and W.D. Beavis. 2017. The predicted cross value for genetic introgression of multiple alleles. 205: 1409–1423.

He, H. and E.A. Garcia. 2009. Learning from imbalanced data. IEEE Trans. Knowl. Data Eng. 21: 1263– 1284.

Heffner, E.L., J.L. Jannink and M.E. Sorrells. 2011. Genomic selection accuracy using multifamily prediction models in a wheat breeding program. Plant Genome. 4: 65–75.

Henderson, C.R. 1984. Applications of Linear Models in Animal Breeding. Guelph Ontario, CA: Univ. Guelph.

Hernández-Lobato, J.M., J. Requeima, E.O. Pyzer-Knapp and A. Aspuru-Guzik. 2017. Parallel and distributed Thompson sampling for large-scale accelerated exploration of chemical space. Proc. Int. Conf. Mach. Learn. pp.1470-1479.

Heslot, N., H.P. Yang, M.E. Sorrells and J.L. Jannink. 2012. Genomic selection in plant breeding: a comparison of models. Crop Sci. 52: 146–160.

Hickey, J.M., R.F. Veerkamp, M.P.L. Calus, H.A. Mulder and R. Thompson. 2009. Estimation of prediction error variances via Monte Carlo sampling methods using different formulations of the prediction error variance. Genet. Sel. Evol. 41: 23.

Hickey, J.M., S. Dreisigacker, J. Crossa, S. Hearne, R. Babu, B.M. Prasanna, M. Grondona, A. Zambelli, V.S. Windhausen, K. Mathews and G. Gorjanc. 2014. Evaluation of genomic selection training population designs and genotyping strategies in plant breeding programs using simulation. Crop Sci. 54: 1476–1488.

Hoi, S.C.H., R. Jin, J. Zhu and M.R. Lyu. 2006. Batch mode active learning and its application to medical image classification. Proc. 23rd Int. Conf. Mach. Learn, 417–424.

Huang, Y.M. and S.X. Du. 2005. Weighted support vector machine for classification with uneven training class sizes. In: Conf. Proc. IEEE Int. Conf. Syst. Mach. Cybern. 7: 4365–4369.

Hunter, S.R. and B. McClosky. 2016. Maximizing quantitative traits in the mating design problem via simulation-based Pareto estimation. IIE Trans. 48: 565–578.

Isidro, J., J.L. Jannink, D. Akdemir. J. Poland, N. Heslot and M.E. Sorrells. 2015. Training set optimization under population structure in genomic selection. 128: 145–158.

Iwata, H., T. Hayashi, S. Terakami, N. Takada, T. Saito and T. Yamamoto. 2013. Genomic prediction of trait segregation in a progeny population: a case study of Japanese pear (Pyrus pyrifolia). BMC Genet. 14: 81.

Jiang, Y. and J.C. Reif. 2015. Modeling epistasis in genomic selection. Genetics. 201: 759–768.

Jones, D.R., M. Schonlau and W.J. Welch. 1998. Efficient global optimization of expensive black-box functions. J. Glob. Optim. 13: 455–492.

Jordan, D.R., E.S. Mace, A.W. Cruickshank, C.H. Hunt and R.G. Henzell. 2011. Exploring and exploiting genetic variation from unadapted sorghum germplasm in a breeding program. Crop Sci. 51: 1444– 1457.

Kaga, A., T. Shimizu, S. Watanabe, Y. Tsubokura, Y. Katayose, K. Harada, D.A. Vaughan and N. Tomooka. 2012. Evaluation of soybean germplasm conserved in NIAS genebank and development of mini core collections. Breed. Sci. 61: 566¬592.

Khazaei, H., K. Street, A. Bari, M. Mackay and F.L. Stoddard. 2013. The FIGS (Focused Identification of Germplasm Strategy) approach identifies traits related to drought adaptation in Vicia faba genetic resources. PLoS ONE. 8: e63107.

Kumar, S., D. Chagne, M.C.A.M. Bink, R.K. Volz, C. Whitworth and C. Carlisle. 2012. Genomic selection for fruit quality traits in apple (Malus×domestica Borkh.). PLoS ONE. 7: e36674.

Lado, B., S. Battenfield, C. Guzman, M. Quincke, R.P. Singh, S. Dreisigacker, R.J. Pena, A. Fritz, P. Silva, J. Poland and L. Gutierrez. 2017. Strategies for selecting crosses using genomic prediction in two wheat breeding programs. Plant Genome. 10.

Laloë, D. 1993. Precision and information in linear models of genetic evaluation. Genet. Sel. Evol. 25: 557–576.

Lehermeier, C., S. Teyssèdre and C.C. Schön. 2017. Genetic gain increases by applying the usefulness criterion with improved variance prediction in selection of crosses. Genetics. 207: 1651–1661.

Lewis, D.D. and W.A. Gale. 1994. A sequential algorithm for training text classifiers. Proc. 17th Annu. Int. ACM SIGIR Conf. Res. Dev. Inf. Retrieval, pp.3–12.

Lin, H.T., C.J. Lin, and R.C. Weng. 2007. A note on Platt’s probabilistic outputs for support vector machine. Mach. Learn. 68: 267–276.

Malosetti, M., J.M. Ribaut and F.A. van Eeuwijk. 2013. The statistical analysis of multi-environment data: Modeling genotype-by-environment interaction and its genetic basis. Front. Physiol. 4: 44.

Mauricio, R. 2001. Mapping quantitative trait loci in plants: uses and caveats for evolutionary biology. Nat. Rev. Genet. 2: 370–381.

McCouch, S., G. J. Baute, J. Bradeen, P. Bramel, P. K. Bretting, E. Buckler, J. M. Burke, D. Charest, S. Cloutier, G. Cole, H. Dempewolf, M. Dingkuhn, C. Feuillet, P. Gepts, D. Grattapaglia, L. Guarino, S. Jackson, S. Knapp, P. Langridge, A. Lawton-Rauh, Q. Lijua, C. Lusty, T. Michael, S. Myles, K. Naito, R. L. Nelson, R. Pontarollo, C. M. Richards, L. Rieseberg, J. Ross-Ibarra, S. Rounsley, R.S. Hamilton, U. Schurr, N. Stein, N. Tomooka, E. van der Knaap, D. van Tassel, J. Toll, J. Valls, R.K. Varshney, J. Ward, R. Waugh, P. Wenzl and D. Zamir. 2013. Agriculture: feeding the future. Nature. 499: 23–24.

Meuwissen, T.H.E. 1998. Maximizing the response of selection with a predefined rate of inbreeding. J. Anim. Sci. 76: 2575–2583.

Meuwissen, T.H.E., B.J. Hayes and M.E. Goddard. 2014. Prediction of total genetic value using genome- wide dense marker maps. Genetics. 157: 1819–1829.

Minamikawa, M.F., K. Nonaka, E. Kaminuma, H. Kajiya-Kanegae, A. Onogi, S. Goto, T. Yoshioka, A. Imai, H. Hamada, T. Hayashi, S. Matsumoto, Y. Katayose, A. Toyoda, A. Fujiyama, Y. Nakamura, T. Shimizu and H. Iwata. 2017. Genome-wide association study and genomic prediction in citrus: potential of genomics-assisted breeding for fruit quality traits. Sci. Rep. 7: 4721.

Mockus, J. 1994. Application of Bayesian approach to numerical methods of global and stochastic optimization. J. Glob. Optim. 4: 347–365.

Mohammadi, M., T. Tiede and K.P. Smith. 2015. PopVar: a genome-wide procedure for predicting genetic variance and correlated response in biparental breeding populations. Crop Sci. 55: 2068–2077.

Montesinos-López, O.A., A.M. Montesinos-López P. Pérez-Rodríguez, G. de los Campos, K. Eskridge and J. Crossa. 2015. Threshold models for genome-enabled prediction of ordinal categorical traits in plant breeding. G3 (Bethesda). 5: 291–300.

Morota, G. and D. GIanola. 2014. Kernel-based whole-genome prediction of complex traits: a review. Front. Plant Sci. 5: 363.

Morota, G., R. Abdollahi-Arpanahi, A. Kranis and D. Gianola. 2014. Genome-enabled prediction of quantitative traits in chickens using genomic annotation. BMC Genomics. 15: 109.

Müller, D., P. Schopp and A.E. Melchinger. 2018. Selection on expected maximum haploid breeding values can increase genetic gain in recurrent genomic selection. G3 (Bethesda). 8: 1173–1181.

Nakagawa, H., J. Yamagishi, N. Miyamoto, M. Motoyama, M. Yano and K. Nemoto. 2005. Flowering response of rice to photoperiod and temperature: a QTL analysis using a phenological model. Theor. Appl. Genet. 110: 778–786.

Odong, T.L., J. Jansen, F.A. van Eeuwijk, T.J.L van Hintum. 2013. Quality of core collections for effective utilisation of genetic resources review, discussion and interpretation. Theor. Appl. Genet. 126: 189– 305.

Onogi A, Watanabe M, Mochizuki T, Hayashi T, Nakagawa H, Hasegawa T, Iwata H. 2016. Towards integration of genomic selection with crop modeling: the development of an integrated approach to predicting rice heading dates. Theor. Appl. Genet. 129: 805–817.

Onogi, A., O. Ideta, Y. Inoshita, K. Ebana, T. Yoshioka, M. Yamasaki and H. Iwata. 2015. Exploring the areas of applicability of whole-genome prediction methods for Asian rice (Oryza sativa L.). 128: 41–53.

Ornella, L., P. Pérez, E. Tapia, J.M. González-Camacho, J. Burgueño, X. Zhang, F.S. Vicente, D. Bonnett, S. Dreisigacker, R. Singh, N. Long and J. Crossa. 2014. Genomic-enabled prediction with classification algorithms. Heredity. 112: 616–626.

Pace, J., X. Yu and T. Lübberstedt. 2015. Genomic prediction of seedling root length in maize (Zea mays L.). Plant J. 83: 903–912.

Palloix, A., V. Ayme and B. Moury. 2009. Durability of plant major resistance genes to pathogens depends on the genetic background, experimental evidence and consequences for breeding strategies. New Pytol. 183: 190–199.

Patra, S. and L. Bruzzone. 2012. Cluster-assumption based batch mode active learning technique. Pattern Recognit. Lett. 33: 1042–1048.

Pauwels, E., C. Lajaunie and J.P. Vert. 2014. A Bayesian active learning strategy for sequential experimental design in systems biology. BMC Syst. Biol. 8: 102.

Pérez-Rodríguez, P., D. Gianola, J.M. González-Camacho, J. Crossa, Y. Manès and S. Dreisigacker. 2012. Comparison between linear and non-parametric regression models for genome-enabled prediction in wheat. G3 (Bethesda) 2: 1595–1605.

Perez, P. and G. de los Campos. 2014. Genome-wide regression and prediction with the BGLR statistical package. Genetics. 198: 483–495.

Rincent, R., A. Charcosset and L. Moreau. 2017a. Predicting genomic selection efficiency to optimize calibration set and to assess prediction accuracy in highly structured populations. Theor. Appl. Genet. 130: 2231–2247.

Rincent, R., D. Laolë, S. Nicolas, T. Altman, D. Brunel, P. Revilla, V.M. Rodríguez, J. Moreno-Gonzalez, A. Melchinger, E. Bauer, C.C. Schoen, C. Giauffret, C. Bauland, P. Jamin, J. Laborde, H. Monod, P. Flament, A. Charcosset and L. Moreau. 2012. Maximizing the reliability of genomic selection by optimizing the calibration set of reference individuals: comparison of methods in two diverse groups of maize inbreds (Zea mays L.). Genetics. 192: 715–728.

Rincent, R., E. Kuhn, H. Monod, F.X. Oury, M. Rousset, V. Allard, and J.L. Gouis. 2017b. Optimization of multi-environment trials for genomic selection based on crop models. Theor. Appl. Genet. 130: 1735–1752.

Rutkoski, J.E., J.A. Poland, R.P. Singh, J. Huerta-Espino, S. Bhavani, H. Barbier, M.N. Rouse, J.L. Jannink and M.E. Sorrells. 2014. Genomic selection for quantitative adult plant stem rust resistance in wheat. Plant Genome. 7.

Seko, A. T. Maekawa, K. Tsuda and I. Tanaka. 2014. Machine learning with systematic density-functional theory calculations: application to melting temperatures of single- and binary-component solids. Phys. Rev. B. 89: 054303.

Settles, B. 2009. Active Learning Literature Survey. Computer Sciences Technical Report. University of Wisconsin-Madison. 1648.

Seung, H.S., M. Opper and H. Sompolinsky. 1992. Query by committee. Proc. 5th Annu. Work. Comput. Learn. Theory, 287–294

Shahriari, B., K. Swersky, Z. Wang, R.P. Adams, N. de Freitas. 2016. Taking the human out of the loop: a review of Bayesian optimization. Proc. IEEE. 104: 148–175.

Silver, D., J. Schrittwieser, K. Simonyan, I. Antonoglou, A. Huang, A. Guez, T. Hubert, L. Baker, M. Lai, A. Bolton, Y. Chen, T. Lillicrap, F. Hui, L. Sifre, G. van den Driessche, T. Graepel and D. Hassabis. 2017. Mastering the game of Go without human knowledge. Nature. 550: 354–359.

Snoek, J. and H. Larochelle. 2012. Practical Bayesian optimization of machine learning algorithms. Adv. Neural. Inf. Process. Syst. pp.2951-2959

Soltani, A. and T.R. Sinclair. 2012. Modelling physiology of crop development, growth and yield. UK: CABI publishing

Sorensen, D and D. Gianola. 2002. Likelihood, Bayesian, and MCMC methods in quantitative genetics. Springer.

Spindel, J., H. Begum, D. Akdemir, P. Virk, B. Collard, E. Redona, G. Atlin, J.L. Jannink and S.R. McCouch. 2015. Genomic selection and association mapping in rice (Oryza sativa): effect of trait genetic architecture, training population composition, marker number and statistical model on accuracy of rice genomic selection in elite, tropical rice breeding lines. PLoS Genet. 11: e1004982.

Srinivas, N., A. Krause, S. Kakade and M. Seeger. 2010. Gaussian process optimization in the bandit setting: No regret and experimental design. Proc. Int. Conf. Mach. Learn. pp.1015–1022.

Tanksley, S.D. and McCouch S.R. 1997. Seed banks and molecular maps: unlocking genetic potential from the wild. Science. 227: 1063–1066.

Technow, F., C.D. Messina, L.R. Totir and M. Cooper. 2015. Integrating crop growth models with whole genome prediction through approximate Bayesian computation. PLoS ONE 10: e0130855.

Tiede, T., L. Kumar, M. Mohammadi and K.P. Smith. 2015. Predicting genetic variance in bi-parental breeding populations is more accurate when explicitly modeling the segregation of informative genomewide markers. Mol. Breed. 35: 199.

Tipping, M.E. 2001. Sparse Bayesian learning and the relevance vector machine. J. Mach. Learn. Res. 1: 211–244.

Tong, S. and Koller D. 2001. Support vector machine active learning with applications to text classification. J. Mach. Learn. Res. 2: 45–66.

Tuia, D., F. Ratle, F. Pacifici, M.F. Kanevski and W.J. Emery. 2009. Active learning methods for remote sensing image classification. IEEE Trans. Geosci. Remote Sens. 47: 2218–2232.

van Berloo, R. and P. Stam. 1998. Marker-assisted selection in autogamous RIL populations: a simulation study. Theor. Appl. Genet. 96: 147–154.

VanRaden, P.M. 2008. Efficient methods to compute genomic predictions. J. Dairy Sci. 91: 4414–4423.

Wang, K., D. Zhang, Y. Li, R. Zhang and L. Lin. 2017. Cost-effective learning for deep image classification. IEEE Trans. Circuits. Syst. Video Technol. 27: 2591–2600.

Wang, W et al. 2018. Genomic variation in 3,010 diverse accessions of Asian cultivated rice. Nature. 567: 43–49.

Warmuth, M.K., J. Liao, G. Rätsch, M. Mathieson, S. Putta and C. Lemmen. 2003. Active learning with support vector machines in the drug discovery process. J. Chem. Inf. Comput. Sci. 43: 667–673.

Würschum, T., J.C. Reif, T. Kraft, G. Janssen and Y. Zhao. 2013. Genomic selection in sugar beet breeding populations. BMC Genet. 14: 85.

Yabe, S. H. Iwata and J.L. Jannink. 2017. A simple package to script and simulate breeding schemes: the breeding scheme language. Crop Sci. 57: 1347–1354.

Yabe, S. R. Ohsawa and H. Iwata. 2013. Potential of genomic selection for mass selection breeding in annual allogamous crops. Crop Sci. 53: 95–105.

Yabe. S., T. Hara, M. Ueno, H. Enoki, T. Kimura, S. Nishimura, Y. Yasui, R. Ohsawa and H. Iwata. 2018. Potential of genomic selection in mass selection breeding of an allogamous crop: an empirical study to increase yield of common buckwheat. Front. Plant Sci. 9: 276.

Yamamoto, E., H. Matsunaga, A. Onogi, H. Kajiya-Kanegae, M. Minamikawa, A. Suzuki, K. Shirasawa, H. Hirakawa, T. Nunome, H. Yamaguchi, K. Miyatake, A. Ohyama, H. Iwata and H. Fukuoka. 2016. A simulation-based breeding design that uses whole-genome prediction in tomato. Sci. Rep. 6: 19454.

Yao, J., D. Zhao, X. Chen, Y. Zhang and J. Wang. 2018. Use of genomic selection and breeding simulation in cross prediction for improvement of yield and quality in wheat (Triticum aestivum L.). Crop J. 6: 353–365.

Yin, X., M.J. Kropff, T. Horie, H. Nakagawa, H.G.S. Centeno, D. Zhu and J. Goudriaan. 1997. A model for photothermal responses of flowering in rice I. model description and parameterization. Field Crops Res. 51: 189–200.

Yu, H., M.L. Spangler, R.M. Lewis and G. Morota. 2018. Do stronger measures of genomic connectedness enhance prediction accuracies across management units? J. Anim. Sci. sky316

Yu., X., X. Li, T. Guo, C. Zhu, Y. Wu, S.E. Mitchell, K.L. Roozeboom, D. Wang, M.L. Wang, G.A. Pederson, T.T. Tesso, P.S. Schnable, R. Bernardo and J. Yu. 2016. Genomic prediction contributing to a promising global strategy to turbocharge gene banks. Nat. Plants. 2: 16150.

Zhao, K., C.W. Tung, G.C. Eizenga, M.H. Wright, M.L. Ali, A.H. Price, G.J. Norton, M.R. Islam, A. Reynolds, J. Mezey, A.M. McClung, C.D. Bustamante and S.R. McCouch. 2011. Genome-wide association mapping reveals a rich genetic architecture of complex traits in Oryza sativa. Nat. Commun. 2: 467.

Zhao, K., M. Wright, J. Kimball, G. Eizenga, A. McClung, M. Kovach, W. Tyagi, M.L. Ali, C.W. Tung, A. Reynolds, C.D. Bustamante and S.R. McCouch. 2010. Genomic diversity and introgression in O. sativa reveal the impact of domestication and breeding on the rice genome. PLoS ONE 5: e10780.

Zhao, Y., M. Gowda, W. Liu, T. Würschum, H.P. Maurer, F.H. Longin, N. Ranc and J.C. Reif. 2012. Accuracy of genomic selection in European maize elite breeding populations. Theor. Appl. Genet. 124: 769–776.

Zhong, S. and J.L. Jannink. 2007. Using quantitative trait loci results to discriminate among crosses on the basis of their progeny mean and variance. Genetics. 177: 567–576.

Zhu, J., H. Wang, B.K. Tsou and M. Ma. 2010. Active learning with sampling by uncertainty and density for data annotations. IEEE Trans. Audio Speech Lang. Proc. 18: 1323–1331.

参考文献をもっと見る

全国の大学の
卒論・修論・学位論文

一発検索!

この論文の関連論文を見る