Appunti‎ > ‎Formati audio‎ > ‎

Le connessioni digitali

AES3 (AES/EBU)


Questo formato è il primo formato che definisce uno standard fra i vari costruttori di macchine audio a livello professionale. Sviluppato dall’AES (Audio Engineering Society) e dall’EBU (European Broadcasting Union) e presentato nel 1989, è stato aggiornato nel 1995, 1998 e 2003 e permette la trasmissione di due canali di informazione audio digitale, includenti dati audio e non audio. Il formato definisce l’uso di differenti connettori fisici, così il sistema S/P-DIF è stato sviluppato essenzialmente come una versione consumer dell’AES3, usando connettori più comunemente usati nel mercato domestico. L’AES/EBU stabilisce uno standard per condurre due canali audio su un singolo cavo bipolare schermato, ed è stato progettato per portare dati ad una distanza fino a 100 m senza bisogno di equalizzazione; distanze più lunghe sono raggiungibili con l’ausilio di equalizzazione.
I due canali audio sono multiplexati e l’interfaccia non ha bisogno di un segnale separato di sincronizzazione. Il tipo di codice differenziale permette di trasmettere dati tollerando un rumore pari al doppio dei canali che usano un’identificazione a soglia. In ogni caso la banda passante del canale deve essere sufficientemente alta per poter accomodare il bit rate. Per questo motivo, nonostante i connettori dell’AES/EBU siano gli stessi dell’audio XLR, dovrebbero essere usati cavi con banda passante assai superiore a quella audio per assicurare buone performance. Le caratteristiche fissate per un cavo di trasmissione

AES/EBU sono di 110 ohm per quanto riguarda l'impedenza, e di 5.0V per quanto riguarda la tensione. L’interfaccia è capace di trasmettere parole audio lunghe fino a 24 bit. Nella maggior parte dei casi le parole audio non superano i 20 bit e in tale situazione i rimanenti 4 bit destinati all’audio possono essere usati per informazioni ausiliarie. Di recente Sony ha adottato una versione, detta anche "SDIF-2" con connettori BNC (gli stessi del MADI), al fine di semplificarne l’uso in infrastrutture video digitali ed analogiche.


S/P-DIF


Nelle applicazioni semiprofessionali e domestiche questa è senz’altro l’interfaccia digitale più comune. La sigla sta per "Sony/Philips Digital Interface Format".
Questa interfaccia prevede di funzionare con cavi coassiali tipo video utilizzanti connettori phono su una distanza massima di 10 metri. Anche in questo caso, dunque, un cavo audio non è adatto a trasmettere i dati digitali. Vengono utilizzati cavi sbilanciati con connettori RCA, ed è molto importante che i cavi utilizzati per la trasmissione del segnale S/P-DIF abbiano una impedenza di 75 ohm e una tensione di 0.5V. In alternativa, lo S/P-DIF può essere trasmesso su cavo ottico di plastica o di vetro (Toslink). Lo standard dello S/P-DIF, come abbiamo visto, deriva dall’AES3, con qualche differenza riguardo l’impedenza del cavo che scende dai 110 ohm dell’AES3 ai 75 ohm dei più comuni cavetti con connettori RCA, anch’essi implementati per contenere i costi del formato (rilasciato in un periodo in cui le connessioni ottiche erano ancora rare e costose), così nella maggior parte dei casi apparecchiature professionali e amatoriali possono essere connesse tra loro direttamente, sbilanciando un cavo AES3 come si farebbe con un segnale analogico.
Questa tuttavia non è una buona pratica, perché gli standard elettrici sono abbastanza diversi e alcuni bit di stato contengono informazioni diverse, tanto che a volte si possono ottenere con questo metodo risultati imprevedibili. Altre differenze tra i due formati riguardano i subcodici dell’AES3 trasportano informazioni sulle caratteristiche dello stream oltre che testuali, mentre i subcodici dell’ interfaccia S/P-DIF trasmette il segnale di SCMS (Serial Copy Management System) in maniera tale da evitare, sulle apparecchiature domestiche, la possibilità di copie digitali in serie di prodotti preregistrati, come il CD (anche quest’aspetto rivela il periodo storico in cui è nato lo S/ P-DIF, implementando una protezione ormai obsoleta e soprattutto inutile dato il mutato contesto dell’industria).


T-DIF 1 (Tascam)


Il formato Tascam T-DIF 1 (Tascam Digital Interface Format version 1) è stato implementato per la prima volta nelle apparecchiature multitraccia a cassetta Tascam DTRS (Digital Tape Recording System), come il DA-88, il DA-38 e il DA-98. Il formato Tascam T-DIF 1 versione 1 implementa audio 24 bit/48 KHz ed è nato nei primi anni 90 assieme al sistema ADAT di Alesis, del quale è naturale concorrente, al contrario del quale però implementa una connessione bi-direzionale, rendendo necessario l’uso di un solo cavo per trasmettere 8 ingressi ed 8 uscite contemporaneamente. Per la connessione viene impiegato un connettore D-sub a 25 poli che però nelle prime implementazioni non trasmetteva il clock, e necessitava pertanto di un cavo BNC per la sincronizzazione WordClock. Prodotti rilasciati successivamente inclusero la capacità di auto-sincronizzarsi con il solo connettore D-sub, anche se non è regola univoca, e con le specifiche T-DIF 1 version 2 il formato inplementa frequenze di campionamento fino a 192 KHz con proporzionale riduzione dei canali. Attualmente la Tascam X-48 supporta 48 canali di audio bi-direzionale 96 KHz su 6 connettori T-DIF 1, usando una specifica post version 2.


Toslink


Toslink è il nome attribuito ai connettori ottici, introdotti dalla Toshiba. I connettori ottici sono ormai molto diffusi sulle apparecchiature sia consumer che professionali. Il formato trasmesso attraverso i connettori ottici è lo S/P-DIF, ma va sottolineato che il sistema di trasmissione è totalmente differente impedendo la connessione diretta tra connettori S/PDIF coassiali e ottici. La trasmissione lungo il cavo ottico avviene, tramite un fascio di luce rossa, attraverso una fibra ottica di plastica o di vetro. Il trasmettitore è semplicemente un led rosso, il ricevitore è un circuito sensibile alla luce.


ADI (Alesis)


Il formato ottico viene anche utilizzato per la trasmissione del formato ADAT: risoluzione 24 bit e frequenza di campionamento di 48 KHz per 8 canali complessivi. In caso di utilizzo con risoluzioni inferiori l’apparecchio ricevente ignora semplicemente i bit eccedenti la propria risoluzione, inoltre anche se non originariamente previsto è implementato l’uso di frequenze di campionamento di 96 KHz, con relativo dimezzamento del numero di canali trasmesso. Il formato ADAT era presente sui registratori multitraccia ADAT (Alesis Digital Audio Tape) che registravano 8 canali audio digitali su una cassetta S-VHS. Il connettore ottico era implementato per trasmettere/ ricevere questi 8 canali ad un altro ADAT oppure ad una apparecchiatura di registrazione/riproduzione compatibile. Tra i vantaggi del formato la caratteristica di essere “hot swappable”, di poter essere cioè connesso e disconnesso senza dover spegnere gli apparecchi, e di essere “auto-sincronizzante”, il che permette di evitare una connessione supplementare per sincronizzare il clock degli apparecchi interconnessi, come nel caso per esempio del MADI.


MADI

Il significato della sigla MADI è Multichannel Audio Digital Interface. È un’estensione del protocollo AES/EBU, denominato anche AES10 del 1991, per connettere digitalmente apparecchiature multicanale. Il MADI nella sua prima specifica permetteva di convogliare fino a 56 canali audio in modo seriale lungo un singolo cavo terminato BNC a 75 Ohm (o alternativamente su fibra ottica), per distanze fino a 100 metri (fino a 3 Km su fibra ottica), e con le specifiche AES10-2003 il numero dei canali è stato portato a 64 ed il sampling rate portato fino a 96 KHz. È ovviamente l’interfaccia ideale per i registratori digitali multitraccia e le connessioni con mixer digitali senza mai lasciare il dominio numerico. Con un’interfaccia standard AES/EBU ci vorrebbero 2 cavi (andata e ritorno) ogni due canali audio, mentre con l’interfaccia MADI sono sufficienti 2 cavi più un segnale di sincronizzazione per 64 canali di audio. E’ largamente usato nel campo del professionale e non mancano realizzazioni di interfacce informatiche con questo formato di RME, Sydec Audio ed Harrison. MADI presenta molte similitudini protocollari (a parte il numero di canali implementato) con l’interfaccia AES3 o AES/EBU, con la differenza che sono necessari cavi coassiali al posto dei normali cavi bipolari per assicurare la larghezza di banda necessaria.


ADAT Sync

Questo è un formato che trasporta solo il segnale di sincronizzazione occorrente per sincronizzare tra loro più registratori ADAT, senza alcun segnale audio. Viene utilizzato un comune connettore a 9 pin per trasmettere il clock, variabile da 40.4kHz a 50.8kHz.


SDIF-2

La sigla "SDIF-2" sta per "Sony Digital Interface Format" (versione 2) e, come è lecito aspettarsi, è utilizzata soprattutto su macchine Sony. Usa due connettori sbilanciati di tipo BNC, uno per ciascun canale audio, più un terzo connettore per il segnale di sincronismo, il Word Clock. Tale segnale permette di sincronizzarsi sulle parole a 32 bit che vengono trasmesse ed è ovviamente funzione della frequenza di campionamento. 20 bit sono usati per l’audio e i rimanenti per altri scopi come l’identificazione dell’enfasi nonché il permesso di trasferimento dati mediante l’interfaccia SDIF-2, oltre ai bit di controllo e di sincronizzazione. In alcune macchine multitraccia l’interfaccia SDIF-2 è nella versione bilanciata.


ProDigi

Questo formato è adottato dalle macchine digitali Mitsubishi e Otari per trasmettere segnali digitali tra registratori multitraccia digitali a testina stazionaria. È un’interconnessione seriale che trasmette i dati nella loro forma complementata. Ci sono due connettori, denominati Dub-A e Dub-B, che servono per i registratori multitraccia, mentre quello denominato Dub-C è per le macchine stereo. Dub-A e Dub-B usano linee bilanciate; sono trasmesse parole di lunghezza 32 bit insieme ad un singolo impulso di clock. Sedici canali sono trasmessi attraverso ogni connettore. Il connettore Dub-C trasmette invece soltanto due canali.


m-LAN

E’ un formato originariamente sviluppato da Yamaha, presentato nel 2000 e destinato alla trasmissione sincronizzata di audio multicanale fino a 24 bit/192 KHz, video, segnali di controllo e MIDI multi-porta fino ad un massimo di 400 Mbps su una connessione IEEE 1394, altrimenti detta FireWire. L’acronimo sta per Music Local Area Network, e sfrutta per la connessione normali cavi FireWire, permettendo, tramite un software appropriato, ad una qualunque DAW (Digital Audio Workstation) di interagire con un hardware mLan compatibile tramite una normale porta FireWire. E’ un formato ceduto in licenza royalty-free a chiunque interessato ad utilizzarlo e a tutto il 2005 oltre 100 case produttrici fanno parte della mLan alliance.


Audio over Ethernet

Audio over Ethernet (AoE) è un protocollo per la trasmissione di audio su una rete Ethernet, in modo da rimpiazzare fruste di connessioni con un solo affidabile collegamento, nella maggior parte dei casi già esistente all’interno di studi o palchi. Per quanto ricalchi il protocollo voice over IP (VoIP), vi differisce per quanto riguarda l’elevata ampiezza di banda, inteso com’è per il trasporto di audio ad alta fedeltà e non di parlato, ed in più è pensato per un uso multicanale isocrono non compresso ed una bassa latenza (sotto i 6 msec). L’AoE può essere inplementato su una local-area network (LAN), o almeno su una virtual LAN (VLAN), e adopera un suo protocollo proprietario che crea i pacchetti dati ed i frame di dati da trasmettere direttamente nell’Ethernet (layer 2) ottendo un’elevata efficienza. Il word clock è generato dai pacchetti broadcast. Essendo una tecnologia informatica abbastanza recente soffre della ormai ben nota tendenza a generare un notevole numero di formati tra loro incompatibili, di seguito elenchiamo i più “blasonati”:

  • AES50
  • SuperMAC, implementazione dell’ AES50 di SonyOxford
  • CobraNet di Peak Audio (adesso proprietà di Cirrus Logic)
  • RAVE di QSC Audio
  • EtherSound di Digigram
  • NetCIRA di Fostex
  • Livewire di Axia/Telos (usato principalmente in broadcasting) • M11
  • MaGIC
  • REAC di Roland 

Tutti questi protocolli usando cavi di rete Cat 5 e hub e switch 100BASE possono generalmente trasmettere fino a 64 canali con risoluzione 24 bit e campionamento a 48kHz. Alucni possono implementare frequenze di campionamento più elevate, 88.2 e 96kHz (2°— oversampling), fino a 192kHz (4°—), così come risoluzioni di 32-bit, con una proporzionale riduzione del numero di canali scambiati.Sebbene AoE non sia pensato per le reti wireless, c’è la tendenza all’uso di alcuni di questi protocolli con vari apparati 802.11.