オンラインで音声ファイルを変換する方法
音声ファイルには多くの形式があり、すべてのデバイスやプラットフォームがすべてをサポートしているわけではありません。形式間の変換により、どこでも音声を再生し、ファイルサイズを減らし、編集用のファイルを準備し、またはポッドキャストプラットフォームのアップロード制限内に収められます。各形式が存在する理由、どこで輝き、どこで噛みつくかを理解することは、変換を当て推量から小さくて信頼できる技能に変えます。
音声形式の簡単な歴史
物語は1991年のWAV、MicrosoftとIBMの非圧縮PCMサンプル用ラッパーから始まります。WAVはシンプルで、大きく、普遍的でした。今日でも音声編集のリンガフランカです。1993年に最終化され、MPEG-1 Audio Layer IIIとして標準化された MP3(Fraunhofer Institut)の到来はすべてを変えました。50 MBのWAVは、ほぼ同じに聞こえる5 MBのMP3になり、突然ポータブルプレーヤーとダイヤルアップ音楽共有が実用的になりました。
AACは1997年にMP3の後継として続き、同じビットレートでより良い品質を提供し、iPodとiTunes用にAppleに採用されました。OGG Vorbis(2000年)はオープンソースコミュニティとゲーム開発者によって支持された特許フリーの代替として登場しました。FLAC(2001年)は、ハードドライブがそれを保存するのに十分大きくなったときに、ロスレス音楽アーカイブの標準になりました。Opus(2012年、IETF RFC 6716)はモダンな圧縮チャンピオンです。ほぼすべてのビットレートでMP3、AAC、Vorbisを打ち負かし、WebRTC、Discord、YouTube、Zoom、ほとんどのモダンな音声と音楽ストリーミングを動かしています。各世代は、互換性が(生の品質ではなく)採用を駆動するため、以前の形式を流通させ続けました。
音声形式の説明
MP3: 最も広くサポートされた非可逆形式。過去30年間に作られた事実上すべてのデバイスとプラットフォームで動作します。192から320 kbpsで品質とファイルサイズの良いバランス。特許は2017年に切れたため、現在はどこでもロイヤリティフリーです。
WAV: 非圧縮音声。完璧な品質ですが非常に大きなファイル(ステレオCD品質音声の1分あたり約10 MB)。音声編集、放送ワークフロー、ゲームの短いサウンドエフェクトの標準形式。
AAC: Appleの好まれる非可逆形式。同じビットレートでMP3よりわずかに良い品質。iTunes、YouTube、Apple Music、ほとんどのストリーミングサービスで使用。MP4コンテナに保存されているとき、ファイルは通常.m4a拡張子を持ちます。
OGG Vorbis: オープンソースの非可逆形式。AACに似た品質、ゲーム(Minecraft、Half-Life 2、多くのインディータイトル)とWikipediaで自由ライセンス音声に一般的に使用。
FLAC: ロスレス圧縮。WAVと比較してファイルサイズを約50から60%減らしながら、完璧な音質を保持します。高解像度音楽アーカイブ、オーディオファイル試聴、Bandcampダウンロードで人気。
Opus: ほとんどのビットレートですべての古いコーデックを打ち負かすモダンなオープン形式。WebRTC、Discordボイス、YouTubeショートフォームのデフォルトで、低遅延ゲームボイスにますます採用されています。スピーチと音楽モードをシームレスに組み合わせます。
ALAC: Apple Lossless。FLACと同じ考えですが、Appleエコシステムサポート付き。ファイルは.m4a(ロスレスバリアント)で終わります。ライブラリがiTunes / Apple Musicにあるなら有用。
WMA: Windows Media Audio。レガシーWindowsアプリケーションの外ではほぼ廃れています。携帯性のためにMP3またはAACに変換してください。
AIFF: AppleのWAV相当、非圧縮で大きい。古いMacintosh音声ワークフローで使用。
変換するとき
| From | To | 理由 |
|---|---|---|
| WAV | MP3 | 共有またはストリーミングのためにファイルサイズを減らす |
| WAV | FLAC | およそ半分のサイズでロスレスアーカイブ |
| FLAC | MP3 | 古いデバイスとの互換性または25 MBメールに収める |
| MP3 | WAV | 編集の準備(再圧縮を避ける) |
| M4A / AAC | MP3 | 非Appleデバイスとの互換性 |
| WMA | MP3またはAAC | レガシーMicrosoft形式から離れる |
| AIFF | FLAC | 品質損失なしでより小さなアーカイブ |
| 任意 | OGG / Opus | Webプロジェクト、ゲーム、ボイスチャット |
| 任意 | Opus | モダンな音声または低ビットレート音楽 |
| WAV | AAC | YouTubeアップロード(音声トラック)用に小さなファイル |
オンラインで音声を変換する手順
- 音声ファイルをアップロード: サポートされた任意の形式(MP3、WAV、AAC、OGG、FLAC、M4A、WebM、AIFF)のファイルを選択します。ブラウザがローカルでデコードします。
- 出力形式と品質を選ぶ: ターゲット形式とビットレートを選択します。高いビットレートはより良い品質を意味しますが、より大きなファイルになります。
- 必要ならチャンネルとサンプルレートを選ぶ: ポッドキャストにはモノラル、音楽にはステレオ、CD品質には44.1 kHz、音声が動画と組み合わされるときは48 kHz。
- 変換されたファイルをダウンロード: 変換をクリックして結果をダウンロードします。すべてはブラウザで実行されます。アップロードはありません。
バッチ変換には、複数のファイルをキューに入れ、コンバーターは順番にそれらを処理します。各ファイルはブラウザのWeb Audio APIでデコードされ、WebAssemblyコンパイル済みコーデックで再エンコードされます。
ビットレート、サンプルレート、チャンネルの理解
任意の音声ファイルのサイズと品質を決定する3つの数値。それぞれが何をするかを知ることで、推測なしに目的に合った設定を選べます。
ビットレートは音声の1秒あたりに使われるデータ量を測定します。高ビットレート = より良い品質 = より大きなファイル。非可逆コーデックでは、ビットレートが最も重要な品質コントロールです。
| ビットレート | 品質 | 最適な用途 |
|---|---|---|
| 32から64 kbps | 音声グレード | AMラジオ品質、低帯域幅音声 |
| 96 kbps | スピーチに許容可能 | オーディオブック、講義、非常に圧縮されたポッドキャスト |
| 128 kbps | 音楽に許容可能 | 音声録音、カジュアルなポッドキャスト |
| 192 kbps | 良い | 一般的なリスニング |
| 256 kbps | 非常に良い | 音楽、慎重なリスニング |
| 320 kbps | 優秀 | 非可逆アーカイブ、最高のMP3品質 |
| 可変(V0、V2) | 最高の効率 | モダンなMP3 / Opus |
ほとんどの目的では、192から256 kbpsがスイートスポットで、ほとんどの人が元との違いを言えないほどよく、ファイルを管理可能な状態に保ちます。Opusはずっと低いビットレートで透明な品質に達します。96 kbpsのOpusはしばしば192 kbpsのMP3と同等です。
サンプルレートは1秒に何回音声スナップショットが撮られるかです。44.1 kHz(CD品質)と48 kHz(放送と動画)はほぼすべてをカバーします。22 kHzはスピーチのみのポッドキャストには問題なく、ファイルサイズを半分にします。96 kHzや192 kHzはスタジオ制作にのみ重要です。消費者の再生は違いを解決できません。
チャンネル: モノラルは1チャンネルを使い、ファイルを半分にします。ステレオは2つを使います。5.1と7.1サラウンドは映画とゲーム音声に有用です。話される音声はステレオから利益を得ないため、ほとんどのポッドキャストはモノラルで出荷されます。
CBR、VBR、ABR
ファイル全体にわたってビットレート予算を使う3つの方法:
- CBR(固定ビットレート): 音声の各秒は同じビット数を使います。予測可能なファイルサイズ、ストリーミングが容易、静かな部分でわずかに無駄。
- VBR(可変ビットレート): エンコーダーは複雑な部分により多くのビットを使い、無音にはより少なく。バイトあたりのより良い品質。ローカルファイルに推奨。
- ABR(平均ビットレート): 中間: 特定の平均をターゲットにし、ローカルの変動を許可。今日はあまり一般的ではありません。
モダンな使用には、品質ターゲット付きのVBR(Opus品質5、LAME V2、AAC品質0.5)が知覚品質とファイルサイズの最高比を与えます。
よくある落とし穴
- 非可逆から非可逆への変換: MP3からAACはすでに圧縮された音声を再エンコードし、不具合の上に不具合を積み重ねます。持っていればつねにWAVまたはFLACのソースに戻ってください。
- 話し言葉に320 kbpsを使う: ポッドキャストとオーディオブックは高い音楽ビットレートから何も得ません。64から96 kbpsモノラルOpusまたは96から128 kbps MP3は同じに聞こえ、帯域幅を節約します。
- 動画とのサンプルレート不一致: 48 kHz動画タイムラインと組み合わされた44.1 kHzの音声は、長い動画で同期がずれます。プロジェクトのサンプルレート(通常、動画では48 kHz)に合わせてください。
- 音量正規化を無視: 異なるソースは大幅に異なる知覚音量を持ちます。ほとんどのポッドキャストプラットフォームはモノラルに-16 LUFS、ステレオに-14 LUFSを推奨します。一部のコンバーターはエクスポート時に正規化できます。
- 誤ってメタデータを取り除く: MP3 ID3タグ(タイトル、アーティスト、アルバム、カバーアート)は音声ストリームとは別に存在します。一部のコンバーターは静かにそれらを削除します。ライブラリの整理を気にするなら、出力をチェックしてください。
- モノラル / ステレオの混同: 両チャンネルに同じ波形を持つステレオファイルは、帯域幅が2倍のモノラルファイルにすぎません。適切なときはモノラルにエンコードしてください。
- M4Aバリアントの混同:
.m4aコンテナはAAC(非可逆)またはALAC(ロスレス)を保持できます。一方をもう一方に名前変更しても変換にはなりません。正しいエンコーダーが必要です。 - 5.1の間違ったチャンネルレイアウト: チャンネル順は形式間で変動します(L、R、C、LFE、Ls、Rs対L、R、Ls、Rs、C、LFE)。間違った順序は中央のダイアログを後ろのスピーカーから再生します。
- 編集するたびにポッドキャストを再エンコード: WAVで編集し、最後に一度MP3にエクスポートします。各MP3ラウンドトリップは品質を低下させます。
- アップロード制限を忘れる: メールは25 MBに、Twitterは140秒に上限を設け、多くのプラットフォームには独自の癖があります。320 kbpsでエクスポートして、やり直す必要があると発見する前にチェックしてください。
代替ツールと文脈
Webコンバーターは1つまたは少数のファイルに最速の経路です。バッチ、スクリプティング、またはスタジオ作業には、コマンドラインツールとDAWが引き継ぎます。
| ツール | プラットフォーム | 強み | 注意点 |
|---|---|---|---|
| Web音声コンバーター | ブラウザ | インストール不要、アップロード不要、バッチUI | 速度はデバイスに依存 |
| ffmpeg | CLI、クロスプラットフォーム | 音声 / 動画のスイスアーミーナイフ | 冗長なフラグ、急なカーブ |
| sox | CLI、クロスプラットフォーム | 音声特化、エフェクトチェーンに優秀 | 小さなコミュニティ |
| LAME(CLI) | CLI、クロスプラットフォーム | 参照MP3エンコーダー、V0からV9品質 | MP3のみ |
Opus tools(opusenc) | CLI | 最高品質のOpusエンコーダー | 単一形式 |
| Audacity | デスクトップ | バッチ変換付きの無料エディタ | 変換だけが必要なら重い |
| Reaper / Logic / Pro Tools | デスクトップDAW | スタジオ編集とマスタリング | 有料、変換には過剰 |
| iTunes / Apple Music | デスクトップ | 組み込みAACとALACエンコーディング | macOS中心 |
| HandBrake | デスクトップ | 動画から音声抽出 | 動画優先UI |
ffmpeg -i in.wav -c:a libopus out.opus | CLIワンライナー | プログラム的 | コーデックフラグを正しく |
ポッドキャストパイプラインの自動化には、ffmpegスクリプトが勝ちます。一度限りの互換性変換には、Webコンバーターが速くよりプライベートです。
プライバシーとコンバーター
音声コンバーターは完全にブラウザ内で動作します。選択したファイルはFileReader APIで読まれ、ブラウザのWeb Audio APIでデコードされ、WebAssemblyコーデックでターゲット形式に再エンコードされます。アップロードなし、ロギングなし、共有なしです。機密素材(ボイスメモ、インタビュー録音、ポッドキャストエピソードの下書き、プライベートな会議の文字起こし)には、そのローカル専用フローが、見知らぬサーバーを信頼することと誰も信頼しないことの違いです。音声ファイルはしばしば隠しメタデータを運びます。タイトルとアーティスト付きのID3タグ、録音デバイスのシリアル番号、電話のマイクからのGPS座標、タイムスタンプなど、第三者に保持されたくないデータです。Canvasスタイルのローカルパイプラインは、それらすべてをコントロール下に保ちます。形式の切り替えのような日常的なタスクには、プライバシーのデフォルトは、何もページを離れない、何も保存されない、何も共有されない、であるべきです。
よくある質問
音声変換は品質を低下させますか?
WAVまたはFLACへの変換はロスレスです, 品質の損失はありません。MP3、AAC、OGGへの変換はロッシー圧縮を適用します。256〜320 kbpsでは、品質の違いはほとんどの耳には知覚できません。
最高の音声形式は?
単一の「最高の」形式はありません。MP3が最も互換性があります。AACは同じビットレートでMP3よりわずかに良い音です。FLACはアーカイブ用にロスレスです。WAVは非圧縮で、編集用に普遍的です。
複数のファイルを一度に変換できますか?
はい。複数のファイルをアップロードすると、次々に変換されます。個別にまたはZIPアーカイブでダウンロードしてください。
音声ファイルはサーバーに送信されますか?
いいえ。すべての処理はブラウザ内で行われます。ファイルはデバイスに残ります。
What is the difference between bitrate and sample rate?
Sample rate is how many times per second the audio is captured (44.1 kHz for CDs, 48 kHz for video). Bitrate is how many bits of data are used per second of audio after compression. Sample rate sets the maximum possible frequency; bitrate sets how much detail is preserved at that sample rate.
Should I use VBR or CBR?
Variable bitrate (VBR) gives better quality per byte because it spends more bits on complex passages and fewer on silence. Constant bitrate (CBR) is more predictable for streaming and easier to seek through. For local files, VBR; for live streaming, CBR.