映像ファイルから音声トラックを抽出してMP3形式に変換する理由はいくつかあります。
その一つのケースとして、AIのトランスクライブ(音声の書き起こし)を行うために、
音声のみのファイルを用意する必要があります。
映像ファイルのままだとファイルサイズが大きく、処理が重くなることがありますが、
音声のみのファイルにすることでこれを避けることができます。
以下に、簡単に音声ファイルを用意する方法を説明します。
本ページでは今後のローカル環境でのスクリプト化を実現するために、コマンドラインで操作する方法を記載しています。
目次
1. ffmpegのインストール
まず、ffmpeg
をインストールします。Homebrew
というパッケージマネージャーを使うと簡単にインストールできます。Homebrewがインストールされていない場合は、以下のコマンドでインストールしてください:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
次に、ffmpeg
をインストールします:
brew install ffmpeg
2. 映像ファイルをMP3に変換する
ffmpeg
がインストールされたら、ターミナルを開いて以下のコマンドを実行します。input_video.mp4
は変換したい映像ファイルの名前に、output_audio.mp3
は生成されるMP3ファイルの名前に置き換えてください。
ffmpeg -i input.mp4 -q:a 0 -map a output_audio.mp3
3. コマンドの詳細
-i input_video.mp4
: 変換する映像ファイルを指定します。-q:a 0
: 音声品質を指定します。0
は最も高い品質を意味します。-map a
: 映像ファイルの音声トラックのみを抽出します。output_audio.mp3
: 生成されるMP3ファイルの名前です。
4. 変換の確認
コマンドが実行されると、指定した場所にMP3ファイルが生成されます。このファイルを再生して、変換が成功したかどうかを確認してください。
5. 10分ファイルに指定して分割する
音声ファイルを特定の時間ごとに分割し、その後ファイルサイズを確認して調整する方法を紹介します。
ステップ1: 音声ファイルの長さを確認する
音声ファイルの長さを確認するには、以下のコマンドを使用します:
ffmpeg -i output_audio.mp3 2>&1 | grep "Duration"
ステップ2: 音声ファイルを分割する
音声ファイルを例えば10分ごとに分割するには、以下のコマンドを使用します:
ffmpeg -i output_audio.mp3 -f segment -segment_time 900 -c copy output_audio_part_%03d.mp3
上記のコマンドは、音声ファイルを10分(600秒)ごとに分割します。分割されたファイルはoutput_audio_part_001.mp3
、output_audio_part_002.mp3
、…という名前で保存されます。
これで、映像ファイルをMP3に変換する作業は完了です。
何か他に質問があれば教えてください。