学習ニュース拾い読み記事のアイキャッチ画像

英文読解中の眼球運動を記録した大規模データセットを公開|筑波大学


コーパスは、言語学において、自然言語処理の
研究に用いるために自然言語の文章を
構造化し大規模に集積したデータです。
このような膨大なデータを用いて研究や
最近ではAIでも用いられています。

コーパス|Wikipedia
https://ja.wikipedia.org/wiki/コーパス

筑波大学の研究チームは、母語や外国語での
読解における眼球運動データを大規模に収集して
体系的に整理して公開するという取り組みとして、
日本語を母語とする英語学習者の
大学生・大学院生41名が協力者として参加し、
総計41万語以上に対する眼球運動データセットを
構築・公開。

このデータセットは、
Tsukuba Eye-tracking Corpus (TECO)として
オープンサイエンスのプラットフォームにて公開しているそうです。
詳しくはリンク記事でご確認ください。

英文読解中の眼球運動を記録した大規模データセットを公開 | 社会・文化 – TSUKUBA JOURNAL
文章を読む際の眼球運動を記録し、言語処理の研究に用いることは盛んに行われています。本研究では、日本語を母語とする英語学習者が文章を読解した際の眼球運動データを収集し、総計で約41万語以上に対する眼球運動データセットをTsukuba Eye-tracking Corpus (TECO)として構築・公開しました。
www.tsukuba.ac.jp

[PR]