大量のテキストデータを分析する方法として
知られているテキストマイニング。
大学の研究でも多くの研究者が
テキストマイニングの手法を使って
さまざまな研究結果を発表しています。
今回は、このテキストマイニングを使って、
世界中の言語の構造的特徴の共通点や
相違点を明らかにするための研究を
ご紹介します。
東京理科大学、埼玉大学の研究グループは、
8言語
(ギリシャ語、英語、ドイツ語、フランス語、
ロシア語、フィンランド語、中国語、日本語)
で書かれた4種類の文書
(新約聖書の福音書 (マルコ伝、マタイ伝、
ルカ伝、ヨハネ伝))、国連議事録、
パリ協定、小説)
のテキストデータを解析。
解析の結果、わかったこととは?
詳しくはリンク記事でご確認ください。
情報源: 【プレスリリース】単語の共起ネットワークによる言語の構造的特徴の定量化に成功 ~言語の壁を越えた新たなデータ解析法の実現に寄与~ | 日本の研究.com
[PR]