リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

大学・研究所にある論文を検索できる 「日本語談話関係認識のための理論とコーパス構築」の論文概要。リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

コピーが完了しました

URLをコピーしました

論文の公開元へ論文の公開元へ
書き出し

日本語談話関係認識のための理論とコーパス構築

金子, 貴美 お茶の水女子大学

2020.03.23

概要

自然言語処理研究の究極的な目標の 1 つは「計算機に文章・文脈を理解させること」である。文章は、それを構成する各文を意味解析しただけでは導出できない、文間の構造に関わる意味を持っているため、上記目標を実現するには、文間や節間にある意味的な繋がり関係を解析する必要がある。このような、文や節といった談話片間の意味的関係のことを談話関係と呼ぶ。

談話関係と時間関係は相互に依存しているため、そのような依存関係を考慮して談話関係の定義がなされるべきである。しかしながら、談話関係に関するいずれの関連研究も、談話関係と時間関係の依存関係を反映した設計となっているとは言い難い。そのような設計ができていない一因として、いずれの関連研究も解釈が揺れる「話し手や書き手の意図に関する関係」と、解釈が一意に定まる関係とを十分に選り分けられていないことがある、と推察される。

上記の問題点を踏まえ、本研究では、話し手や書き手の意図に関する関係と、解釈が一意に定まる関係とを選り分け、後者について、時間関係との依存関係を反映した、談話関係の決定手順を確立することを目指し、談話関係を再定義する。具体的には、上記の実現のためにまず、出来事 (eventuality)、モダリティ (modality)、時制 (tense)、時間関係 (temporal relation) と、談話関係との依存関係の整理を行い、それを元に談話関係の分類体系と客観的な談話関係の決定手順を定義する。その後、定義した分類体系と決定手順に従ってアノテーション実験を行い、一致率の算出やエラー分析を行うことにより、「解釈が一意に定まる関係のみに絞って談話関係を定義できたか」を検証し、談話関係の決定プロセスのどの部分を明らかにできたか、および、どの部分に課題が残るかを議論する。

この論文で使われている画像

参考文献

[1] W. C. Mann, and S. Thompson. Rhetorical structure theory: A theory of text organization. Technical report, University of Southern California, Information Sciences Institute, 1987.

[2] F. Wolf, E. Gibson, A. Fisher, and M. Knight. The Discourse GraphBank: A database of texts annotated with coherence relations. Philadelphia: Linguistic Data Consortium, 2005.

[3] R. Prasad, A. Joshi, N. Dinesh, A. Lee, E. Miltsakaki, and B. Webber. The Penn discourse treebank as a resource for natural language generation. In the Corpus Linguistics Workshop on Using Corpora for Natural Language Generation, pp. 25–32, 2005.

[4] N. Asher and A. Lascaridas. Logics of Conversation: Studies in Natural Language Processing. Cambridge University Press, 2003.

[5] L. Carlson, D. Marcu, and M. E. Okurowski. RST Discourse Treebank LDC2002T07. Philadel- phia: Linguistic Data Consortium, 2002.

[6] F. Wolf, E. Gibson, A. Fisher and M. Knight. A procedure for collecting a database of texts annotated with coherence relations. Database Documentation, 2003.

[7] M. Marcus, B. Santorini, and M. A. Marcinkiewicz. Building a large annotated corpus of En- glish: The Penn TreeBank. Computational Linguistics, Vol. 19, No. 2, pp. 313–330, 1993.

[8] H. Ku˘cera, and W. N. Francis. Computational Analysis of Present-Day American English. Brown University Press, 1967.

[9] R. Prasad, N. Dinesh, A. Lee, E. Miltsakaki, L. Robaldo, A. Joshi, and B. Webber. The Penn Discourse TreeBank 2.0. In Proceedings, 6th International Conference on Language Resources and Evaluation, pp. 2961–2968, 2008.

[10] R. Prasad, B. Webber, A. Lee, and A. Joshi. The Penn Discourse Treebank 3.0. Philadelphia: Linguistic Data Consortium, 2019.

[11] H. Kamp and U. Reyle. From Discourse to Logic; Introduction to the Model theoretic Semantics of natural language. Model theoretic Semantics of natural language, 1993.

[12] B. Reese, J. Hunter, N. Asher, P. Denis, and J. Baldridge. Reference manual for the analysis and annotation of rhetorical structure (version 1.0). Technical report, Austin: University of Texas, Departments of Linguistics and Philosophy, 2007.

[13] D. Kawahara, Y. Machida, T. Shibata, S. Kurohashi, H. Kobayashi, and M. Sassano. Rapid Development of a Corpus with Discourse Annotations using Two-stage Crowdsourcing. In Pro- ceedings of the 25th international conference on Computational Linguistics, pp. 269–278, 2014.

[14] Y. Kishimoto, S. Sawada, Y. Murawaki, D. Kawahara, and S. Kurohashi. Improving Crowdsourcing-Based Annotation of Japanese Discourse Relations. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation, pp. 4044–4048, 2018.

[15] 岸本裕大, 澤田晋之介, 村脇有吾, 河原大輔, 黒橋禎夫. クラウドソーシングを用いた談話関係アノテーションの改良. 言語処理学会第 23 回年次大会発表論文集, pp. 819–822, 2017.

[16] K. Murakami, E. Nichols, S. Matsuyoshi, A. Sumida, S. Masuda, K. Inui, and Y. Matsumoto. Statement Map: Assisting Information Credibility Analysis by Visualizing Arguments. In Pro- ceedings of the 3rd Workshop on Information Credibity on the Web, pp. 43–50, 2009.

[17] J. Bos, S. Clark, M. Steedman, J. R. Curran, and J. Hockenmaier. Widecoverage semantic representations from a CCG parser. In Proceedings of the 20th international conference on Computational Linguistics, pp. 1240–1246, 2004.

[18] P. Mart´ınez-Go´mez, K. Mineshima, Y. Miyao, and D. Bekki. ccg2lambda: A Compositional Semantics System. In Proceedings of the 54th Annual Meeting of the Association for Computa- tional Linguistics - System Demonstrations, pp. 85–90, 2016.

[19] 戸次大介. 日本語文法の形式理論: 活用体系・統語構造・意味合成. 第 24 巻, くろしお出版, 2010.

[20] 川添愛, 齊藤学, 片岡喜代子, 崔栄殊, 戸次大介. 言語情報の確実性に影響する表現およびそのスコープのためのアノテーションガイドライン Ver.2.4. Technical Report of Department of Information Science, Ochanomizu University, OCHA-IS 10-4, 2011.

[21] 益岡隆志. 日本語モダリティ探究. くろしお出版, 2007.

[22] 宇津木舞香. 依存型理論による日本語のテンスの分析. お茶の水女子大学 大学院人間文化創成科学研究科 修士論文, 2017.

[23] 金田一春彦. 国語動詞の一分類. 言語研究 15, 1950.

[24] 寺村秀夫. 日本語のシンタクスと意味 II. くろしお出版, 1984.

[25] 中村ちどり. 日本語の時間表現. 第 14 巻, くろしお出版, 2001.

[26] J. Pustejovsky, J. M. Castano, R. Ingria, R. Sauri, J. Robert, G. A. Setzer, G. Katz, and D. R. Radev. TimeML: Robust specification of event and temporal expressions in text. New directions in question answering, Vol. 3, pp. 28–34, 2003.

[27] J. Pustejovsky, K. Lee, H. Bunt, and L. Romary. ISO-TimeML: An International Standard for Semantic Annotation. In Proceedings of the Seventh International Conference on Language Resources and Evaluation, pp. 394–397, 2010.

[28] M. Asahara, S. Yasuda, H. Konishi, M. Imada, and K. Maekawa. BCCWJ-timebank: Tempo- ral and event information annotation on Japanese text. In the 27th Pacific Asia Conference of Language Information and Computation, pp. 206–214, 2013.

[29] K. Maekawa. Balanced Corpus of Contemporary Written Japanese. In Proceedings of the 6th Workshop on Asian Language Resources (ALR-8), pp. 101–102, 2008.

[30] 浅原正幸, 松本裕治. 『現代日本語書き言葉均衡コーパス』に対する係り受け・並列構造アノテーション. 言語処理学会第 19 回年次大会発表論文集, pp. 66–69, 2013.

[31] P. Stenetorp, S .Pyysalo, G. Topic´, T. Ohta, S. Ananiadou, and J. Tsujii. BRAT: a Web-based Tool for NLP-Assisted Text Annotation. In Proceedings of the Demonstrations at the 13th Conference of the European Chapter of the Association for Computational Linguistics, pp. 102– 107, 2012.

[32] 松村明. 「委任」. 大辞林第 3 版, 三省堂, 2006.

参考文献をもっと見る

全国の大学の
卒論・修論・学位論文

一発検索!

この論文の関連論文を見る