Nvidia、欧州言語向けAI強化のための大規模オープンデータセットを公開
Nvidiaは欧州言語の高品質AI翻訳開発を支援する大規模オープンデータセット『Granary』を公開した。
最新の更新
シリコンANGLEによると、地球上の7,000以上の言語のうち、人工知能モデルでサポートされているのはごくわずかです。そこでNvidiaは、欧州言語向けの高品質AI翻訳開発を支援するため、大規模なAI対応オープンデータセットとモデルを発表しました。新しいデータセット『Granary』は、100万時間以上の多言語音声、65万時間の音声認識データ、35万時間の音声翻訳データを含むオープンソースコーパスです。Nvidiaの音声AIチームはカーネギーメロン大学やFondazione Bruno Kesslerの研究者と協力し、未ラベル音声や公開音声データをAI学習に利用可能な情報へと変換しました。Granaryには、欧州連合の24の公用語に加え、ロシア語やウクライナ語を含む25の欧州言語が収録され、データが限られているクロアチア語、エストニア語、マルタ語なども含まれています。
好きかもしれない
- ニュージーランドの航空管制障害、データ転送の不具合が原因か
- iOS 26、iPhone 16シリーズに25W Qi2ワイヤレス充電を対応
- NASA、宇宙からの大気質監視ミッションを延長
- Microsoft、Windows 11の新しいカスタマイズ可能なスタートメニューをテストユーザー向けに提供開始
- Google、2026年1月にGmailifyとPOPサポートを終了
- サムスンGalaxy S25 Edge、S25 Plusの終焉を示す可能性
- Microsoft、Copilotアプリのホームページを大幅刷新 Windowsのスタートメニュー風に変更
- マイクロソフト、大学の人事システムを狙う「給与海賊」ハッカーを警告