リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

大学・研究所にある論文を検索できる 「機械翻訳における同義文章生成モデルの検討」の論文概要。リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

コピーが完了しました

URLをコピーしました

論文の公開元へ論文の公開元へ
書き出し

機械翻訳における同義文章生成モデルの検討

京極 健悟 早稲田大学

2021.03.15

概要

1.1 研究背景
近年,⼈⼯知能(AI)技術を利⽤した電⼦機器の開発が活発になっている.特に⾃然⾔語処理の分野では,⼈々の⽣活を⽀えている製品やサービスが増えている.iOS や macOS などに内蔵されている Siri では,⾃然⾔語処理を⽤いて⽇常会話の受け答えやメッセージ送信などが可能であり,容易にアシスト機能を楽しめる.その他,テキストの⾃動翻訳や⾃動要約,情報検索や情報抽出など⾃然⾔語処理は⼈々の⽣活を⽀えている.
また,⾃然⾔語処理の中でも特に機械翻訳は精度が⼤幅に向上している.現在,Google 翻訳ではニューラル機械翻訳を使⽤している.⼤量の蓄積データをもとにニューラルネットワークを利⽤し,機械翻訳を実⾏している.しかし,翻訳家は⾔葉の⾔い回し,時代背景,読み⼿を意識した翻訳ができる.現状では,機械翻訳は翻訳家による翻訳結果を再現することができない.
そこで,本研究では,翻訳家による特⾊を機械翻訳により再現する.翻訳データを学習データとして⽤い,翻訳の特⾊を学習した⽂章⽣成モデルを作成することで.任意の⽂章に対応したドメイン変換を取得できる.これにより,より⾃然な⽂章表現の⽣成を⽬指す.

1.2 研究⽬的
⼊⼒⽂章の意味を理解した上で,⽂章の⾃動⽣成をすることができれば,⾼度な⾃動応答システムや,チャットボット,記事の⾃動作成などに利⽤することができる.また,⼊⼒⽂章の特⾊を再現できれば,任意の⽂章でもその特⾊を付与することが可能になる.そこで,本研究では,⽂章の意味を理解し,特定著者の作⾵を再現した同義⽂章を返答するモデルの作成を⽬的とする.

1.3 本論⽂の構成
本論⽂の構成を以下に⽰す.
第1章は本章であり,本論⽂の研究の背景および⽬的について述べる.
第2章では,⽂章⽣成モデル T5 の概要および本研究で⽤いる関連技術を説明する.
第3章では,翻訳家による特⾊を機械翻訳により再現し評価する⼿法を提案する.第4章では,提案⼿法における実験および結果について述べる.
第5章では,本研究のまとめと今後の課題について述べる.

参考文献

[1] C. Raffel, N. Shazeer, A. Roberts, K. Lee, S. Narang, M. Matena, Y. Zhou, W. Li, P. J. Liu, "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer", Oct 2019

[2] Jacob Devin, Ming-Wei Chang Kentin Lee, Kristina Toutanova, ”BERT: Pre-training of Deep Bidrectional Transformers for Language Understanding”,NAACL,pp.4171-4186,2019”

[3] TensorFlow Datasets C4<https://www.tensorflow.org/datasets/catalog/c4>参照 2021.1.20

[4] A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez, L. Kaiser, I. Polosukhin, "Attention Is All You Need", Dec 2017

[5] Taku Kudo, John Richardson, "SentencePiece: A simple and language independent subword tokenizer and detokenizer for Neural Text Processing", Aug 2018v

[6] 京都⼤学情報学研究所,京都⼤学情報学研究所ホームページ:”MeCab: Yet Another Part-of-Speech and Morphological Analyzer”, <http://taku910.github.io/mecab/>, 参照 2021.1.20.

[7] 京都⼤学⼤学院情報学研究所,⿊橋・河原研究室ホームページ:”⽇本語形態素解析システ ム JUMAN++”,<http://nlp.ist.i.kyoto-u.ac.jp/index.php?JUMAN++> 参 照 2021.1.20.

[8] TensorFlow Datasets Wikipedia <https://www.tensorflow.org/datasets/catalog/wikipedia>参照 2021.1.20

[9] Charles.M.Schulz“とっておきスヌーピー”, 産経新聞社, vol. 1-7,Sept.2000

[10] オブジェクトの広場,技術部アドバンステクノロジーセンター,鵜野 和也”はじめての⾃然⾔語処理 ”< https://www.ogis-ri.co.jp/otc/hiroba/technical/similar-document- search/part7.html#13>参照 2021.1.20.

参考文献をもっと見る

全国の大学の
卒論・修論・学位論文

一発検索!

この論文の関連論文を見る