学習ニュース拾い読み記事のアイキャッチ画像

日本語に強い大規模言語モデル「Swallow」を公開 英語が得意な大規模言語モデルに日本語を教える|東京工業大学

OpenAI社のChatGPTやGPT-4、
そしてGoogle社のPaLM2やGeminiなど、
大規模言語モデルの研究が進められており、
多くの人が利用できるようになっています。

しかし、日本語にも対応しているとはいえ、
こうした大規模言語モデルの多くは日本語を
ベースとして構築されたわけではありません。

東京工業大学と国立研究開発法人
産業技術総合研究所の共同研究グループは、
現在公開されている日本語に対応した
大規模言語モデルとしては最大規模であり、
オープンで商用利用が可能な「Swallow」を公開。

その「Swallow」の特徴とは?
詳しくはリンク記事でご確認ください。

日本語に強い大規模言語モデル「Swallow」を公開 英語が得意な大規模言語モデルに日本語を教える | 東工大ニュース | 東京工業大学
要点 日本語能力に優れビジネスにも安心して活用できる大規模言語モデルを公開 継続事前学習により大規模言語モデルの日本語能力を改善 高度な日本語処理が求められる多くの場面で、生成AI技術の利活用を推進 概要東京工業大学(以下、東工大) 情報理工学院 情報工学系の岡崎直観教授と横田理央教授らの研究チームと国立研究開発法人 産業技術総合研究所(以下、産総研)は、日本語能力に優れた生成AIの基盤…
www.titech.ac.jp

[PR]