CD Audio: valutare la qualità delle registrazioni

21 febbraio 2013

 

 

Le figure di Lissajous rappresentano graficamente la composizione di moti armonici:

 

x = A cos(wt + fase)

y = B cos(wt)

 

w rappresenta la pulsazione, t è il tempo, fase rappresenta la differenza di fase tra x e y e A e B sono le rispettive ampiezze. Questo è il caso più semplice che crea una elisse di semiassi A e B. La figura sarà tutta contenuta in un rettangolo di lati A e B.

 

Figura: semplici figure di Lissajous

 

Se utilizziamo, per x e y, i canali destro e sinistro di un programma musicale stereofonico la figura di Lissajous rappresenterà la  funzione parametrica definita dal sistema

 

x = canale_Sinistro(t)

y =canale_Destro(t)

 

il grafico che ne deriva sarà molto più complicato. I valori assunti dal segnale estratto da un CD Audio vanno da –32768 a +32767. Dato che una traccia audio contiene milioni di campioni discreti più che una figura si ottiene una macchia composta da una moltitudine di punti. Alcune caratteristiche sono comunque riconoscibili. Per prima cosa si vede immediatamente se il segnale è limitato in ampiezza o se è sovramodulato (troppo amplificato).


Punto

Canale Sinistro

Canale Destro

A

Massimo

Nullo

B

Massimo

Massimo

C

Nullo

Minimo

D

Nullo

Nullo

E

Massimo

Nullo

F

Minimo

Nullo

Figura e Tabella: Nella figura sono indicati alcuni punti notevoli. La linee blu e verdi indicano i due canali. Se un canale fosse nullo la figura si ridurrebbe a una di queste due linee. Se invece i canali sono identici (traccia monofonica) la figura si riduce alla diagonale.

 

La figura che segue rappresenta 6 situazioni: nelle prime tre i segnali rimangono all’interno dei limiti di Massima Modulazione Assoluta (quadrato rosso). Tecnicamente queste tracce, dal punto di vista della modulazione (ovvero dell’ampiezza del segnale) sono corrette. La prima figura riproduce una macchia circolare  che indica un ampio effetto stereofonico (massima entropia). La seconda mostra una macchia allungata lungo la diagonale (canale centrale dominante).  Nella terza l’asse della macchia non coincide con la diagonale. Ciò significa che il segnale di un canale è mediamente più ampio dell’altro.

 

Le successive tre figure rappresentalo situazioni con un diverso grado di limitazione dell’ampiezza. Nella quarta figura la modulazione è sfruttata all’ l’85% circa della modulazione ma si capisce che poteva essere sfruttata di più. Nella successiva la modulazione è sfruttata all’80%: i bordi appaiono appiattiti e manca continuità con quella “sfumatura” che si vede solo parzialmente perpendicolarmente alla diagonale. La sesta ed ultima traccia è sovramodulata (l’ampiezza del segnale eccede i limiti di modulazione fissati per il formato CD). Per ottenere questo ultimo tipo di figura basta alzare il livello dei segnali fino a provocare la saturazione di un qualunque stadio delle catena di registrazione.

 

Se prima di ascoltare queste sei tracce qualcuno avesse chiesto: quale traccia “potenzialmente” può suonare meglio?

personalmente avrei risposto “una delle prime tre” .

Se invece la domanda fosse stata: quale traccia suona più forte?

la risposta sarebbe stata “quella con il valore RMS maggiore” (una delle ultime due).

 

Ciò non toglie che la prima traccia (tecnicamente corretta) possa riprodurre il rumore di uno sciacquone mentre l’ultima una bellissima melodia. Questo ancora non significa che, in pratica, una traccia limitata o compressa possa suonare gradevolmente anche se, per percepire i cosiddetti “dettagli” di una registrazione, per prima cosa questi devono essere presenti ed è difficile contestare che, in una traccia limitata o sovramodulata, almeno una parte di questi “dettagli” sia stata cancellata.

 

Una figura di Lissajous si dovrebbe presentare come una macchia, più o meno estesa, contornata da una corona di punti la cui densità si riduce verso i bordi (senza mai raggiungerli). La zona sfumata è generata dai picchi di segnale (meno frequenti). La figura di Lissajous non mostra molto più di quanto detto. Al massimo si potrebbe ipotizzare che la prima traccia (macchia circolare) contiene una quantità maggiore di suono riverberato (sulla base del fatto che la correlazione tra suono diretto e riflessioni remote tende a scemare).

 

 

 


corretta, molto riverbero


corretta, poco riverbero


canale centrale non allineato


Limitata


Molto Limitata


Sovramodulazione

Figura: 6 tipi di figure di Lissajous

 


ASDA (Analisi Statistica della Distribuzione dell’Ampiezza)

 
 
La ASDA calcola alcune quantità caratteristiche del segnale e la distribuzione statistica dell’ampiezza. Vengono calcolati Il valore medio (che dovrebbe essere nullo), Il valore di picco (al massimo 32767), il valore RMS ed il fattore di cresta (rapporto tra valore di picco e valore RMS). Il valore RMS si riferisce al segnale applicato ad un amplificatore da 100 watt su 8 ohm pilotato al limite del clipping. In sostanza si prende il segnale lo si applica all’ingresso di un ampli da 100 Watt/8ohm e si alza il volume in modo che il picco massimo del segnale produca una tensione di uscita pari a 40 Volt. Quindi si misura il valore RMS all’uscita dell’amplificatore sull’intero brano musicale. Se il fattore di cresta del brano musicale vale 14.14 il valore RMS del segnale vale 2.83 Volt e l’amplificatore avrà prodotto 1 Watt di potenza RMS (40 volt di picco). Fattore di cresta elevati implicano minore potenza RMS dissipata e viceversa. Un valore di cresta basso è associato a brani musicali con contrasti dinamici limitati. La ASDA indica anche per quanto tempo il segnale supera il 70% della Massima Modulazione Relativa. Se questo tempo è breve (millisecondi) significa che i picchi del segnale sono brevi e, anche se l’amplificatore dovesse saturare, non si avranno effetti udibili appariscenti (clipping ideale). Ciò permette di alzare il volume oltre il limite teorico.
La prossima figura mostra l’analisi di una traccia pressoché perfetta: l’ampiezza del segnale si concentra sotto al 3% della Massima Modulazione Relativa che viene raggiunta solo da qualche campione. Il fattore di cresta è alto e l’unico neo è un valore medio diverso da zero che però non ha alcun effetto pratico sulla riproduzione (Moussorgsky: Pictures at an Exhibition & Night on Bald Mountain - Lorin Maazel - The Cleveland Orchestra - Telarc CD-80042 - traccia 1). Se tutte le registrazioni fossero così ci sarebbe ben poco da discutere. Lo spettro del segnale è stato introdotto per verificare la presenza di frequenze sub-soniche e l’andamento dello spettro in funzione del genere musicale. Si nota per esempio che, nella musica classica, il contenuto energetico delle frequenze elevate è più contenuto.
 

Figura : esempio di ASDA quasi perfetta.

 

Esistono due fenomeni distinti: da una parte la saturazione dell’amplificatore (che avviene quando si alza troppo il volume) e dall’altra le sovramodulazioni già presenti nelle tracce dei CD (che non possono essere eliminate).

Dopo aver analizzato oltre mille tracce estratte da CD Audio, possiamo distinguere 3 situazioni:

 

-          -          tracce non limitate

-          -          tracce stondate

-          -          tracce troncate o sovramodulate

 

“Pictures at an Exhibition” è un esempio di traccia non limitata. Le tracce “stondate” sono quelle limitate ma che non presentano appiattimento del segnale. Un esempio di traccia troncata si vede nella figura che segue e ben dimostra cosa si intenda per segnale appiattito o “troncato” o sovramodulato.

 

Figura: tipica traccia troncata.

 

Un modo per distinguere una traccia “troncata” da una “stondata” consiste nel contare per quante volte viene raggiunta la Massima Modulazione Relativa. 

Consideriamo le ASDA delle due tracce che seguono. Entrambe sono sovramodulate. Nella prima troviamo quasi cinquantasette mila campioni tra l’85 ed il 100% della Massima Modulazione Relativa che corrispondono a oltre 1 secondo di musica.  Di questi diverse centinaia raggiungono il valore massimo. Questa è una traccia “troncata”.

 

Nella seconda troviamo ancora un secondo e mezzo di musica nello stesso intervallo di ampiezza ma solo 3 campioni (destro + sinistro) raggiungono il valore massimo (traccia “stondata”).

 

Tra i due mali questo appare essere il minore e, in quanto tale, preferibile. Potendo scegliere chi scrive preferirebbe non vedere sovramodulazioni o limitazioni tanto dell’uno che dell’altro tipo.

 

Queste analisi non dicono se una traccia suona bene o male al massimo si potrà dire se una traccia potrebbe suonare meglio (se non fosse limitata in ampiezza…).

 

Prima di parlare di “microdettaglio” o di “microdinamica” (concetti soggettivamente validi) si dovrebbe dare una occhiata  alla ASDA della traccia in questione. Ove siano presenti pesanti limitazioni dell’ampiezza, sovramodulazioni  o fattori di cresta particolarmente bassi (minori di quattro), ha poco senso cercare il pelo sull’uovo. Per poter attribuire eventuali difetti di riproduzione all’amplificatore piuttosto che ai diffusori è necessario essere certi della qualità tecnica del programma musicale. Questa può essere valutata “a orecchio” ma non è male farsi aiutare anche da una ASDA e dalle figure di Lissajous. Un’ultima annotazione sul fattore di cresta: il rumore rosa artificialmente sintetizzato presenta un fattore di cresta tipico di 3.75 quindi un brano musicale con un fattore di creta inferiore a 4 ha le stesse caratteristiche dinamiche del rumore rosa che si utilizza per fare le misure (al quale è richiesto un CF minimo).

Per singoli strumenti registrati in ambienti anecoici si osservano fattori di cresta superiori a 45 mentre nelle tracce estratte da CD audio non ho trovato fattori di cresta superiori a 28. Quando si misurano valori superiori è bene verificare non trattarsi di una anomalia come accade nell’esempio riportato di seguito.

 


Figura: un picco anomalo presente in una traccia che falsa il calcolo del fattore di cresta (Aida - DG) – il picco comprende 6 campioni, dura 136 micro secondi e non è udibile.

 

 

 

 

 

Lo studio del fattore di cresta dei segnali musicali aiuta a comprendere meglio i sistemi multiamplificati.

 

 

0.02 Hz

100 Hz

500 Hz

1000 Hz

2000 Hz

Pbasso

 

7.48

8.83

8.81

9.44

Palto

9.08

10.22

14.25

18.53

32.36

Fattore di cresta delle due uscite PA e PB di un filtro cross-over ideale al variare della frequenza di cross-over

 

Figura:  traccia “troncata” – il picco massimo viene raggiunto da molti campioni


Figura: Traccia “stondata” -  il picco massimo viene raggiunto solo da 3 campioni.
 

 

 

 

 

Firebird Suite con un altro programma di analisi