コーパスは、言語学において、自然言語処理の
研究に用いるために自然言語の文章を
構造化し大規模に集積したデータです。
このような膨大なデータを用いて研究や
最近ではAIでも用いられています。
コーパス|Wikipedia
https://ja.wikipedia.org/wiki/コーパス
筑波大学の研究チームは、母語や外国語での
読解における眼球運動データを大規模に収集して
体系的に整理して公開するという取り組みとして、
日本語を母語とする英語学習者の
大学生・大学院生41名が協力者として参加し、
総計41万語以上に対する眼球運動データセットを
構築・公開。
このデータセットは、
Tsukuba Eye-tracking Corpus (TECO)として
オープンサイエンスのプラットフォームにて公開しているそうです。
詳しくはリンク記事でご確認ください。
[PR]