機械翻訳における同義文章生成モデルの検討
概要
1.1 研究背景
近年,⼈⼯知能(AI)技術を利⽤した電⼦機器の開発が活発になっている.特に⾃然⾔語処理の分野では,⼈々の⽣活を⽀えている製品やサービスが増えている.iOS や macOS などに内蔵されている Siri では,⾃然⾔語処理を⽤いて⽇常会話の受け答えやメッセージ送信などが可能であり,容易にアシスト機能を楽しめる.その他,テキストの⾃動翻訳や⾃動要約,情報検索や情報抽出など⾃然⾔語処理は⼈々の⽣活を⽀えている.
また,⾃然⾔語処理の中でも特に機械翻訳は精度が⼤幅に向上している.現在,Google 翻訳ではニューラル機械翻訳を使⽤している.⼤量の蓄積データをもとにニューラルネットワークを利⽤し,機械翻訳を実⾏している.しかし,翻訳家は⾔葉の⾔い回し,時代背景,読み⼿を意識した翻訳ができる.現状では,機械翻訳は翻訳家による翻訳結果を再現することができない.
そこで,本研究では,翻訳家による特⾊を機械翻訳により再現する.翻訳データを学習データとして⽤い,翻訳の特⾊を学習した⽂章⽣成モデルを作成することで.任意の⽂章に対応したドメイン変換を取得できる.これにより,より⾃然な⽂章表現の⽣成を⽬指す.
1.2 研究⽬的
⼊⼒⽂章の意味を理解した上で,⽂章の⾃動⽣成をすることができれば,⾼度な⾃動応答システムや,チャットボット,記事の⾃動作成などに利⽤することができる.また,⼊⼒⽂章の特⾊を再現できれば,任意の⽂章でもその特⾊を付与することが可能になる.そこで,本研究では,⽂章の意味を理解し,特定著者の作⾵を再現した同義⽂章を返答するモデルの作成を⽬的とする.
1.3 本論⽂の構成
本論⽂の構成を以下に⽰す.
第1章は本章であり,本論⽂の研究の背景および⽬的について述べる.
第2章では,⽂章⽣成モデル T5 の概要および本研究で⽤いる関連技術を説明する.
第3章では,翻訳家による特⾊を機械翻訳により再現し評価する⼿法を提案する.第4章では,提案⼿法における実験および結果について述べる.
第5章では,本研究のまとめと今後の課題について述べる.