国立情報学研究所情報学研究データリポジトリは、
「研究者等提供データセット」として、
情報・システム研究機構 データサイエンス
共同利用基盤施設人工知能法学研究支援センターより
受け入れた「日本の判例HTMLデータ」の提供を開始。
このデータは、最高裁判所が公開している
判例集のPDFデータをテキスト化(HTMLデータ化)
したもので、HTMLデータでは、本文内容に
無関係な部分を除去し、小見出し、箇条書き、
段落などの構造を認識して、それぞれに応じた
タグを付与したデータとなっているそうです。
このデータセットの利用目的は学術研究に限定されます。
データの入手方法や詳細はリンクページでご確認ください。
なお、このリンクはアンドラの「役立つ施設やサービス」ページにも
追加しましたのでご利用ください。
https://andla.jp/wp/?page_id=165
[PR]