
目次
ネットワーク・オーディオの基本
ネットワーク・オーディオとは
ネットワーク・オーディオとは、標準的なネットワーク技術(イーサネット)を応用し、音声信号を伝送する方式の総称です。音声信号は「パケット」と呼ばれる小さなデータ単位に分割され、標準的なイーサネット・ケーブル(LANケーブル)とスイッチを介して、複数の機器間で送受信されます。柔軟なシステム構築が可能となり、1台または複数台のコンピューターからシステム全体を一括管理することもできます。
ネットワーク技術の活用が、ネットワーク・オーディオの核心であり、従来のオーディオ伝送にはない柔軟性、拡張性、そして効率性をもたらす基盤となっています。ネットワーク・オーディオには、DanteやAES67などのIPネットワーク技術を基盤とする方式のほか、AVB/TSN(Audio Video Bridging / Time-Sensitive Networkingのような新しく決定論的なオーディオネットワークを採用する方式も含まれます。
本章では、従来のオーディオ伝送方式(アナログ・ケーブルやAES/EBU、MADIなど)と比較しつつ、ネットワーク・オーディオの優位性に触れていきます。
ネットワーク・オーディオの利点

ネットワーク・オーディオは、従来のオーディオ伝送方式と比較して、以下のような多くの利点を提供します。
ケーブル・端子の汎用性
従来のオーディオ伝送では、専用ケーブルを使用する必要がありましたが、ネットワーク・オーディオは、1本のイーサネット・ケーブルで複数の音声信号を伝送できます。また、イーサネット・ケーブルやLANポートは家庭でも使用される一般的なものであり、安価で手軽に入手できます。
柔軟なシステム設計と容易な運用管理
自由なルーティング:物理的な配線を変更することなく、ソフトウェア上で直感的に音声信号の経路(どこからどこへ送るか)を簡単に設定・変更できます。
チャンネル管理:ネットワーク内の各オーディオ・チャンネルを容易に識別でき、ハブを中心としたスター型接続が可能です。さらに、必要に応じて信号の分配も行えるため、デイジーチェーン接続は不要となります。これにより、大規模かつ複雑なシステムでも、容易に構成・管理が可能です。

デバイス検出とリモート制御:ネットワークに接続されたデバイスを検出し、いくつかの方法でリモート・コントロールができるため、運用効率が向上します。
システムの拡張性
機器の追加やチャンネル数の増設が非常に簡単です。ネットワークの帯域幅が許す限り、対応機器をネットワークに接続し、ソフトウェアで設定するだけでシステムを拡張できます。
高品質な音声信号の長距離伝送
ネットワーク・オーディオは、デジタル伝送であるため、アナログ伝送時に起こり得る電気的なノイズなどの影響を受けにくく、音質の劣化のないクリアな伝送が可能です。また、イーサネットの規格に準じて、標準的なCat5e/6のイーサネット・ケーブルで最大100mの伝送が可能なため、効率的かつ高品質な長距離伝送も容易に実現できます。
アナログ/デジタル/ネットワーク・オーディオの比較表
| 特徴 | アナログ伝送 | AES/EBU (AES3) | MADI (AES10) | ネットワーク・オーディオ |
|---|---|---|---|---|
| 基本方式 | 連続信号 | デジタル、ポイント・ツー・ポイント | デジタル、ポイント・ツー・ポイント | デジタル、IPネットワーク・ベース |
| ケーブル | 専用オーディオ・ケーブル(XLR、RCA等) | 110Ω STP (XLR) / 75Ω Coax (BNC) | Coax (BNC) / 光ファイバー (SC/LC) | イーサネット・ケーブル (Cat5e/6等)(光ファイバー配線切り替え可能) |
| チャンネル数/1本 | 1 (モノラル) / 2 (ステレオ) | 2チャンネル | 最大64ch (48 kHz時) | ネットワーク帯域とプロトコルに依存 (数百ch以上も可) |
| 配線 | チャンネル毎に必要 | 2ch毎に必要 | 最大64chを1本で伝送 | 非常にシンプル、1本で多重伝送 |
| ルーティング/信号フロー | 物理的なパッチング/固定のルーティング 一方向信号フロー | 物理的なパッチング/固定のルーティング 一方向信号フロー | 物理的なパッチング/基本的には固定のルーティング 一方向信号フロー | ソフトウェアによる自由なルーティング 双方向信号フロー |
| 拡張性 | 伝送ch数の観点から限定的 拡張のためのデバイスが必要 | 伝送ch数の観点から限定的 拡張のためのデバイスが必要 | 伝送ch数の観点から比較的高い 拡張のためのデバイスが必要 | 非常に高い スイッチングハブへ接続する |
| 信号品質 | ノイズ、劣化の影響を受けやすい | デジタル伝送で高品質、伝送路の安定性高 | デジタル伝送で高品質、伝送路の安定性高 光ファイバー接続時がより劣化しにくい | デジタル伝送で高品質、安定性はネットワーク環境に依存 |
| 長距離伝送 | 課題あり | AES3:100m、AES3id:1000m | Coax:100m、光:2km | イーサネット規格に準拠 (例:100m) (光ファイバー配線切り替え可能) |
| システム/リモート制御 | 主に手動 リモート制御非対応 | 個々のデバイスごとに設定が必要 リモート制御非対応 サンプルレート検知対応 | 個々のデバイスごとに設定が必要 MIDI overMADIや96Kフレームでのサンプルレート検知に対応 | ネットワーク経由で統合制御が可能 |
高品質な伝送を実現するネットワーク・オーディオの技術
先述の基本的なメリットを土台とし、ネットワーク・オーディオはさらにプロフェッショナルな現場で求められる高度な要求に応えるため、以下のような様々なネットワーク技術や設計アプローチを活用しています。
安定した伝送環境を支えるイーサネット・スイッチとネットワーク設計
オーディオ・データがスムーズかつ確実に流れるためには、ネットワークの中核をなすイーサネット・スイッチの選定と、ネットワーク全体の設計が非常に重要です。
- スイッチの特性と選定: 一般的な安価なスイッチはデータをベストエフォート方式(最大限努力するが保証はしない)で処理するため、リアルタイム性が不可欠なオーディオ・データに遅延やタイミングのズレが生じる可能性があります。そのため、多くのネットワーク・オーディオシステムでは、特定の通信を優先するQoS (Quality of Service) 機能を備えた「管理型スイッチ」の利用が推奨されます。ただし、QoSによってある程度の優先制御は可能なものの、確定的(ディタミニスティック)な動作を保証するには不十分であり、安定性を担保するにはさらなる設計上の配慮が必要です。
- 推奨されるネットワーク構成:より高い信頼性を確保するためには、想定される最大のデータ量でも安定して動作するようにネットワーク帯域を十分に確保する「オーバープロビジョニング」や、オーディオ専用の独立したネットワーク(またはVLANによる論理的な分離)を構築することが、多くのプロトコルで推奨されています。
正確な再生タイミングを実現する時刻同期技術
複数のデジタル・オーディオ機器間で、音のサンプル・タイミングをマイクロ秒レベルで正確に一致させる「時刻同期」は、位相ずれによる音質劣化やノイズ、音切れを防ぎ、アンサンブルの一体感を保つために不可欠です。
- PTP (Precision Time Protocol – IEEE 1588):ネットワーク上で非常に高精度な時刻同期を実現する国際標準プロトコルです。Danteをはじめとする多くのネットワーク・オーディオ技術で採用されています。PTPには、バウンダリー・クロック(Boundary Clock)とトランスペアレント・クロック(Transparent Clock)という2つのクロック方式があり、前者はマスター・クロックとして時刻情報を他のデバイスに再配信する機能を持ちます。これにより、正確なクロック情報がスイッチを介して分配され、システム全体の同期が確立されます。
ただし、PTPを高精度で実装するには、スイッチ内部に物理的なシンタナイゼーション(PLLなど)を行う高精度なコンポーネントが必要となり、その結果としてスイッチのコストは高くなります。 - gPTP (generalized PTP – IEEE 802.1AS):gPTPは、PTPv2(IEEE 1588-2019)のうち、AVB/TSN(Audio Video Bridging / Time-Sensitive Networking)向けに最適化されたプロファイルのひとつです。自動構成、フェイルオーバー、エラー検出、パフォーマンスの最適化を目的として設計されています。また、PTPv2が備える多くの柔軟な設定機能や拡張機能を省略することで、実装の複雑さを軽減しつつ、同期精度の向上を図っています。これにより、gPTPは一般的なPTPv2と比べて、ハードウェアやユーザーインターフェースに対する要件が少なく、機器メーカーにとって実装しやすい仕様となっています。gPTPは、レイヤー2でそのまま利用できるPTPv2プロファイルであり、自動構成に対応しているため、エンドユーザーがPTPの設定を意識する必要がない点も大きな特徴です。このような特性から、gPTPはすでに自動車分野で広く活用されており、車内のすべての接続機器が1マイクロ秒以内の精度で時刻同期を実現できます。
安定したオーディオストリームを確保する多様な技術アプローチ
多数のオーディオチャンネルを低遅延かつ途切れることなく伝送するため、各ネットワーク・オーディオ技術は、それぞれの設計思想に基づいた仕組みや標準規格を活用しています。
- AVB/TSN (Audio Video Bridging / Time-Sensitive Networking) におけるアプローチ: AVBは、ユーザーによる複雑な設定なしに、ネットワークインフラ自身が伝送品質を積極的に管理する仕組みを持つIEEE標準規格群です。帯域予約(SRP / IEEE 802.1Q-2019)、パケットの優先制御とスケジューリング(FQTSS / IEEE 802.1Q-2019)、そして高精度な時刻同期(gPTP / IEEE 802.1AS)などがネットワークレベルで定義されており、これによりQoS設定(DiffServなど)やオーバープロビジョニング、高価なPTP対応スイッチといった従来の対策を不要とします。そのため、ユーザーに対してネットワークエンジニアと同等の知識は必要ありません。ただし、その性能を最大限に引き出すには、ネットワーク経路上のすべてのスイッチがAVB/TSNに対応している必要があります。
AVBの標準化委員会は、AVBの仕様が完成した後、その技術の適用範囲を拡大するため「TSN(Time-Sensitive Networking)」へと名称を変更しました。以降、AVBが主に音声および映像の伝送を対象としていたのに対し、TSNでは工業用途や制御システムなど、リアルタイム性が求められる幅広いアプリケーションに対応できるよう、さらなるプロトコルや機能が追加されています。
なお、AVBではオーディオやビデオの送信機器を「トーカー(Talker)」、受信機器を「リスナー(Listener)」と呼びます。 - Danteなどに代表されるIPベース・プロトコルにおけるアプローチ: Danteのような広く普及しているネットワーク・オーディオ技術は、標準的なIPネットワーク上で動作する柔軟性を持ちながら、プロフェッショナルな要求に応える高性能を実現しています。専用のソフトウェア(例:Dante Controller)による直感的なルーティング設定やシステム管理の容易さが大きな特徴です。時刻同期にはPTPを利用し、安定した伝送のためにはQoS設定(DiffServなど)の活用や、前述の適切なネットワーク設計(十分な帯域確保、オーディオ専用VLANの構築など)が推奨されます。そのため、ネットワークの管理に積極的に関与するためには、専用のネットワークやスイッチインフラを追加する必要があることが多いです。多くの対応機器側でも、パケットロスに対する耐性やクロックの安定化など、高度な処理が行われており、実用上非常に安定した低遅延伝送を達成しています。
これらの技術要素を理解し、システム要件や運用形態に応じて最適なプロトコル、機器、そしてネットワーク構成を選択・構築することが、ネットワーク・オーディオの持つ数々のメリットを最大限に活かし、高品質で信頼性の高いオーディオ環境を実現するための鍵となります。
ネットワーク・オーディオの活用シーン
ネットワーク・オーディオは、大規模なシステムにおける音響機器の設置や運用が求められる様々な環境で有用です。反対に、ごく小規模かつシンプルな環境(自宅DAWスタジオ、音楽鑑賞など)を構築するには、アナログ/デジタル(AES、SPDIF、ADAT、MADI)オーディオが適している場合があります。具体的なネットワーク・オーディオの使用例としては、伝送チャンネルの多さ、接続ケーブルの管理・メンテナンスの容易さ、パッチ/ルーティング変更の容易さ、接続デバイスの追加/変更が容易である点から、以下が挙げられます。
- PAシステム(公共アドレスシステム)
大規模な会場やイベントで、ネットワークを通じて音声を送信することで、ケーブルの複雑さや音質の劣化を防ぎます。 - 放送局
放送設備内でのオーディオ伝送には、リアルタイムでの安定性と高精度な同期が求められます。ネットワーク・オーディオはこれらの要求に適しており、複数の機器がネットワーク経由で音声信号をやり取りします。 - 設備音響
音響機器やスピーカーを複数のフロアやエリアに分散配置する場合、配線の管理が容易になります。 - スタジオ
高精度な同期が求められる録音スタジオや制作現場で、音声信号を正確に伝送するために使用されます。
