FFmpeg 8、統合された音声認識によるオンザフライ字幕追加

FFmpeg 8.0がリリースされ、VulkanによるGPU加速動画エンコーディングと、統合された音声認識による動画のオンザフライ字幕生成が可能に。

最新の更新 20252025-08-30T09:41:29Z

FFmpegプロジェクトは、8番目のメジャーバージョンであるFFmpeg 8.0をリリースしました。この新しいバージョンには、Vulkanを使用したGPU加速動画エンコーディングに加え、統合された音声認識を利用して、動画の字幕をオンザフライで自動的に生成する機能が追加されました。特に注目すべきは、音声認識機能にWhisperを統合した点です。WhisperはGeorgi Gerganovによって開発された、OpenAIのWhisper自動音声認識モデルを完全にローカルかつオフラインで動作させるためのプログラムです。このアップデートにより、FFmpegはユーザーが動画に手動で字幕を追加することなく、自動的に字幕を生成することが可能となりました。FFmpeg 8.0は、動画制作や編集のプロセスを大きく効率化する機能を提供しています。

FFmpeg 8、統合された音声認識によるオンザフライ字幕追加

好きかもしれない