オンラインで音声ファイルを変換する方法

· 9 分で読めます

音声ファイルには多くの形式があり、すべてのデバイスやプラットフォームがすべてをサポートしているわけではありません。形式間の変換により、どこでも音声を再生し、ファイルサイズを減らし、編集用のファイルを準備し、またはポッドキャストプラットフォームのアップロード制限内に収められます。各形式が存在する理由、どこで輝き、どこで噛みつくかを理解することは、変換を当て推量から小さくて信頼できる技能に変えます。

音声形式の簡単な歴史

物語は1991年のWAV、MicrosoftとIBMの非圧縮PCMサンプル用ラッパーから始まります。WAVはシンプルで、大きく、普遍的でした。今日でも音声編集のリンガフランカです。1993年に最終化され、MPEG-1 Audio Layer IIIとして標準化された MP3(Fraunhofer Institut)の到来はすべてを変えました。50 MBのWAVは、ほぼ同じに聞こえる5 MBのMP3になり、突然ポータブルプレーヤーとダイヤルアップ音楽共有が実用的になりました。

AACは1997年にMP3の後継として続き、同じビットレートでより良い品質を提供し、iPodとiTunes用にAppleに採用されました。OGG Vorbis(2000年)はオープンソースコミュニティとゲーム開発者によって支持された特許フリーの代替として登場しました。FLAC(2001年)は、ハードドライブがそれを保存するのに十分大きくなったときに、ロスレス音楽アーカイブの標準になりました。Opus(2012年、IETF RFC 6716)はモダンな圧縮チャンピオンです。ほぼすべてのビットレートでMP3、AAC、Vorbisを打ち負かし、WebRTC、Discord、YouTube、Zoom、ほとんどのモダンな音声と音楽ストリーミングを動かしています。各世代は、互換性が(生の品質ではなく)採用を駆動するため、以前の形式を流通させ続けました。

音声形式の説明

MP3: 最も広くサポートされた非可逆形式。過去30年間に作られた事実上すべてのデバイスとプラットフォームで動作します。192から320 kbpsで品質とファイルサイズの良いバランス。特許は2017年に切れたため、現在はどこでもロイヤリティフリーです。

WAV: 非圧縮音声。完璧な品質ですが非常に大きなファイル(ステレオCD品質音声の1分あたり約10 MB)。音声編集、放送ワークフロー、ゲームの短いサウンドエフェクトの標準形式。

AAC: Appleの好まれる非可逆形式。同じビットレートでMP3よりわずかに良い品質。iTunes、YouTube、Apple Music、ほとんどのストリーミングサービスで使用。MP4コンテナに保存されているとき、ファイルは通常.m4a拡張子を持ちます。

OGG Vorbis: オープンソースの非可逆形式。AACに似た品質、ゲーム(Minecraft、Half-Life 2、多くのインディータイトル)とWikipediaで自由ライセンス音声に一般的に使用。

FLAC: ロスレス圧縮。WAVと比較してファイルサイズを約50から60%減らしながら、完璧な音質を保持します。高解像度音楽アーカイブ、オーディオファイル試聴、Bandcampダウンロードで人気。

Opus: ほとんどのビットレートですべての古いコーデックを打ち負かすモダンなオープン形式。WebRTC、Discordボイス、YouTubeショートフォームのデフォルトで、低遅延ゲームボイスにますます採用されています。スピーチと音楽モードをシームレスに組み合わせます。

ALAC: Apple Lossless。FLACと同じ考えですが、Appleエコシステムサポート付き。ファイルは.m4a(ロスレスバリアント)で終わります。ライブラリがiTunes / Apple Musicにあるなら有用。

WMA: Windows Media Audio。レガシーWindowsアプリケーションの外ではほぼ廃れています。携帯性のためにMP3またはAACに変換してください。

AIFF: AppleのWAV相当、非圧縮で大きい。古いMacintosh音声ワークフローで使用。

変換するとき

FromTo理由
WAVMP3共有またはストリーミングのためにファイルサイズを減らす
WAVFLACおよそ半分のサイズでロスレスアーカイブ
FLACMP3古いデバイスとの互換性または25 MBメールに収める
MP3WAV編集の準備(再圧縮を避ける)
M4A / AACMP3非Appleデバイスとの互換性
WMAMP3またはAACレガシーMicrosoft形式から離れる
AIFFFLAC品質損失なしでより小さなアーカイブ
任意OGG / OpusWebプロジェクト、ゲーム、ボイスチャット
任意Opusモダンな音声または低ビットレート音楽
WAVAACYouTubeアップロード(音声トラック)用に小さなファイル

オンラインで音声を変換する手順

  1. 音声ファイルをアップロード: サポートされた任意の形式(MP3、WAV、AAC、OGG、FLAC、M4A、WebM、AIFF)のファイルを選択します。ブラウザがローカルでデコードします。
  2. 出力形式と品質を選ぶ: ターゲット形式とビットレートを選択します。高いビットレートはより良い品質を意味しますが、より大きなファイルになります。
  3. 必要ならチャンネルとサンプルレートを選ぶ: ポッドキャストにはモノラル、音楽にはステレオ、CD品質には44.1 kHz、音声が動画と組み合わされるときは48 kHz。
  4. 変換されたファイルをダウンロード: 変換をクリックして結果をダウンロードします。すべてはブラウザで実行されます。アップロードはありません。

バッチ変換には、複数のファイルをキューに入れ、コンバーターは順番にそれらを処理します。各ファイルはブラウザのWeb Audio APIでデコードされ、WebAssemblyコンパイル済みコーデックで再エンコードされます。

ビットレート、サンプルレート、チャンネルの理解

任意の音声ファイルのサイズと品質を決定する3つの数値。それぞれが何をするかを知ることで、推測なしに目的に合った設定を選べます。

ビットレートは音声の1秒あたりに使われるデータ量を測定します。高ビットレート = より良い品質 = より大きなファイル。非可逆コーデックでは、ビットレートが最も重要な品質コントロールです。

ビットレート品質最適な用途
32から64 kbps音声グレードAMラジオ品質、低帯域幅音声
96 kbpsスピーチに許容可能オーディオブック、講義、非常に圧縮されたポッドキャスト
128 kbps音楽に許容可能音声録音、カジュアルなポッドキャスト
192 kbps良い一般的なリスニング
256 kbps非常に良い音楽、慎重なリスニング
320 kbps優秀非可逆アーカイブ、最高のMP3品質
可変(V0、V2)最高の効率モダンなMP3 / Opus

ほとんどの目的では、192から256 kbpsがスイートスポットで、ほとんどの人が元との違いを言えないほどよく、ファイルを管理可能な状態に保ちます。Opusはずっと低いビットレートで透明な品質に達します。96 kbpsのOpusはしばしば192 kbpsのMP3と同等です。

サンプルレートは1秒に何回音声スナップショットが撮られるかです。44.1 kHz(CD品質)と48 kHz(放送と動画)はほぼすべてをカバーします。22 kHzはスピーチのみのポッドキャストには問題なく、ファイルサイズを半分にします。96 kHzや192 kHzはスタジオ制作にのみ重要です。消費者の再生は違いを解決できません。

チャンネル: モノラルは1チャンネルを使い、ファイルを半分にします。ステレオは2つを使います。5.1と7.1サラウンドは映画とゲーム音声に有用です。話される音声はステレオから利益を得ないため、ほとんどのポッドキャストはモノラルで出荷されます。

CBR、VBR、ABR

ファイル全体にわたってビットレート予算を使う3つの方法:

モダンな使用には、品質ターゲット付きのVBR(Opus品質5、LAME V2、AAC品質0.5)が知覚品質とファイルサイズの最高比を与えます。

よくある落とし穴

代替ツールと文脈

Webコンバーターは1つまたは少数のファイルに最速の経路です。バッチ、スクリプティング、またはスタジオ作業には、コマンドラインツールとDAWが引き継ぎます。

ツールプラットフォーム強み注意点
Web音声コンバーターブラウザインストール不要、アップロード不要、バッチUI速度はデバイスに依存
ffmpegCLI、クロスプラットフォーム音声 / 動画のスイスアーミーナイフ冗長なフラグ、急なカーブ
soxCLI、クロスプラットフォーム音声特化、エフェクトチェーンに優秀小さなコミュニティ
LAME(CLI)CLI、クロスプラットフォーム参照MP3エンコーダー、V0からV9品質MP3のみ
Opus tools(opusenc)CLI最高品質のOpusエンコーダー単一形式
Audacityデスクトップバッチ変換付きの無料エディタ変換だけが必要なら重い
Reaper / Logic / Pro ToolsデスクトップDAWスタジオ編集とマスタリング有料、変換には過剰
iTunes / Apple Musicデスクトップ組み込みAACとALACエンコーディングmacOS中心
HandBrakeデスクトップ動画から音声抽出動画優先UI
ffmpeg -i in.wav -c:a libopus out.opusCLIワンライナープログラム的コーデックフラグを正しく

ポッドキャストパイプラインの自動化には、ffmpegスクリプトが勝ちます。一度限りの互換性変換には、Webコンバーターが速くよりプライベートです。

プライバシーとコンバーター

音声コンバーターは完全にブラウザ内で動作します。選択したファイルはFileReader APIで読まれ、ブラウザのWeb Audio APIでデコードされ、WebAssemblyコーデックでターゲット形式に再エンコードされます。アップロードなし、ロギングなし、共有なしです。機密素材(ボイスメモ、インタビュー録音、ポッドキャストエピソードの下書き、プライベートな会議の文字起こし)には、そのローカル専用フローが、見知らぬサーバーを信頼することと誰も信頼しないことの違いです。音声ファイルはしばしば隠しメタデータを運びます。タイトルとアーティスト付きのID3タグ、録音デバイスのシリアル番号、電話のマイクからのGPS座標、タイムスタンプなど、第三者に保持されたくないデータです。Canvasスタイルのローカルパイプラインは、それらすべてをコントロール下に保ちます。形式の切り替えのような日常的なタスクには、プライバシーのデフォルトは、何もページを離れない、何も保存されない、何も共有されない、であるべきです。

よくある質問

音声変換は品質を低下させますか?

WAVまたはFLACへの変換はロスレスです, 品質の損失はありません。MP3、AAC、OGGへの変換はロッシー圧縮を適用します。256〜320 kbpsでは、品質の違いはほとんどの耳には知覚できません。

最高の音声形式は?

単一の「最高の」形式はありません。MP3が最も互換性があります。AACは同じビットレートでMP3よりわずかに良い音です。FLACはアーカイブ用にロスレスです。WAVは非圧縮で、編集用に普遍的です。

複数のファイルを一度に変換できますか?

はい。複数のファイルをアップロードすると、次々に変換されます。個別にまたはZIPアーカイブでダウンロードしてください。

音声ファイルはサーバーに送信されますか?

いいえ。すべての処理はブラウザ内で行われます。ファイルはデバイスに残ります。

What is the difference between bitrate and sample rate?

Sample rate is how many times per second the audio is captured (44.1 kHz for CDs, 48 kHz for video). Bitrate is how many bits of data are used per second of audio after compression. Sample rate sets the maximum possible frequency; bitrate sets how much detail is preserved at that sample rate.

Should I use VBR or CBR?

Variable bitrate (VBR) gives better quality per byte because it spends more bits on complex passages and fewer on silence. Constant bitrate (CBR) is more predictable for streaming and easier to seek through. For local files, VBR; for live streaming, CBR.