La classificazione delle misure audio

di Mario Bon

18 luglio 2015, 22 luglio 2017

 

La catena di riproduzione audio è composta al minimo da tre dispositivi: la sorgente (lettore), l’amplificatore ed il  sitema di altoparlanti (o diffusori acustici). Il lettore legge un supporto che è la “vera” sorgente. Il supporto può contenere un programma musicale mal registrato  e/o affetto da distorsione e, nel caso di programmi sovramodulati, il tasso di distorsione è molto maggiore di quello prodotto da una catena di riproduzione mediocre.

Le non linearità presenti nel supporto attraversano il lettore,  l’amplificatore e gli altoparlanti quindi lo spettro della distorsione presente nel supporto, sarà  soggetta alla intermodulazione del lettore, dell’amplificatore e dei diffusori acustici. Ad ogni passaggio l’intermodulazione aumenta.

Se osserviamo il segnale a partire dalla uscita del lettore, dell’ampli e dei diffusori osserveremo un tasso di distorsione costante o crescente (non decrescente). In nessun caso osserveremo che la distorsione diminuisce. Ne segue che, per ottenere il miglior risultato possibile, il supporto deve essere il “migliore possibile” nel senso che le non linearità contenute nel programma musicale registrato devono essere nulle indipendentemente dalla tecnica di registrazione o dal contenuto artistico. 

Dal punto di vista “elettronico” è preferibile che la eventuale distorsione si concentri alla fine della catena di riproduzione per cui è preferibile che la distorsione (se proprio ci deve essere) sia prodotta dagli altoparlanti. È lapalissiano che i dispositivi “migliori”  sono quelli lineari ovvero che non producono alcuna distorsione di intermodulazione.

 

Considerato che la registrazione del programma musicale è realizzata con microfoni, preamplificatori, mixer ed elettroniche varie, non è facile ottenere una registrazione ad elevata linearità. Con le giuste tecniche si può fare.

 

Ma lasciamo da parte  il programma musicale, sul quale non possiamo intervenire, e torniamo su elettroniche ed altoparlanti. Quello che è difficile prevedere è quale sarà il tasso di distorsione prodotto da  più dispositivi collegati in cascata (anche perché il risultato dipende dalla particolare forma del segnale riprodotto e quindi è sempre diverso).

Il risultato di questo primo ragionamento è che

 

una buona catena di riproduzione è sensibile alla qualità del supporto. Una catena di riproduzione insensibile alla qualità del programma musicale non è una buona catena di riproduzione.

 

La bassa non linearità  (la bassa distorsione), tuttavia non è una condizione sufficiente per ottenere una “riproduzione ottimale”. L’esperienza mostra che sistemi caratterizzati da un certo tipo di non linearità sono comunque apprezzati. Ciò significa che la bassa non linearità non è nemmeno una condizione necessaria per ottenere una buona riproduzione.

 

La condizione necessaria è che la non linearità si manifesti in modo tale che l’apparato uditivo la confonda con la distorsione aurale che esso stesso produce.

(Ma superato un certo limite questo non è più vero)

 

Oltre  a questo l’esperienza mostra che, per quanto riguarda la distorsione, conviene distinguere:

 

la distorsione di forma

La distorsione di forma riguarda lo “stondamento” o la compressione dei picchi di segnale ed è ben tollerata se dura poco. Tale distorsione è tipica sia degli altoparlanti dinamici che degli amplificatori a valvole con basso tasso di retroazione. La distorsione di forma può raggiungere tassi molto elevati.

la distorsione stazionaria

La distorsione stazionaria è quella che si misura con segnali caratterizzati da fattore di cresta basso (fino a 3 pari a 9 dB circa) e, fintantoché l’apparato uditivo la confonde con la distorsione aurale, è tollerata. La distorsione stazionaria deve essere la più bassa possibile (possibilmente non udibile). Per un sistema di altoparlanti la  distorsione armonica totale non si dovrebbe superare un tasso dell1% a 90 dB SPL (da 80 a 20kHz) ed essere limitata alla seconda e terza armonica.

 

Attenzione perché la distorsione “tollerabile” è comunque udibile e contribuisce alla fatica da ascolto. La distorsione “non udibile” è come se non ci fosse (non contribuisce e alla fatica da ascolto). Arriviamo così a formare due tipi di catene di riproduzione:

 

Primo tipo

catena caratterizzata da distorsione che si confondono con la distorsione aurale

 

Secondo tipo

catena caratterizzata da distorsione non udibile o comunque bassa e tollerata per lunghi periodi (ore).

Terzo tipo

catena caratterizzata da distorsione non tollerabile o tollerabile solo per brevi periodi (decine di minuti). Non è Alta Fedeltà

 

Il secondo tipo è ben caratterizzato dalle misure.

 

Le misure

 

Gli stimoli (uditivo, visivo, olfattivo, ecc.) provengono dal mondo esterno. L’uomo riceve questi stimoli e ne ricava (nell’ordine) sensazioni, percezioni, emozioni e sentimenti. Rispetto allo stesso stimolo

 

-          le sensazioni sono simili anche in individui diversi

-          le percezioni sono diverse anche per lo stesso individuo.

 

Percezioni, emozioni e sentimenti sono soggettive e private. Anche se è possibile riprodurre alcune emozioni (per esempio la paura) i sistemi di misura attuali misurano gli stimoli e forniscono risultati che al massimo possono essere correlati alle sensazioni.  La catena di riproduzione può, al massimo, riprodurre al meglio il segnale presente nel supporto.

 

Ricordiamo che il messaggio sonoro viene processato in modo diverso a seconda del suo contenuto:

linguaggio, musica e rumore, sono processati in aree del cervello diverse. Non ha quindi alcun senso cercare di correlare i risultati ottenuti con onde quadre con l’ascolto della musica. I segnali artificiali sono utili ma non facilmente correlabili alla qualità della riproduzione percepita.

 

Le misure  sono di tre tipi e rispondono a tre domande diverse: cosa?, come? chi?

 

Primo tipo (cosa): Riguardano il dispositivo come "strumento di trasduzione".

Queste misure prescindono dal programma musicale e dal "soggetto che ascolta".

Lo scopo è sostanzialmente rilevare limiti e difetti tecnici. Può essere  utilizzato qualsiasi tipo di stimolo (sinusoidi, impulsi, rumore, ecc.). Sul questo tipo di misure non c'è molto altro da dire:  chi le sa fare le fa e, se le sa anche interpretare, ottiene dei risultati. Queste sono le misure che hanno consentito l’evoluzione tecnica. Queste misure si correlano, in modo più o meno diretto, alla sensazione uditiva. Gli esempi più conosciuti sono: misura di rumore, risposta in frequenza, impedenza elettrica, distorsione armonica. 

 

Secondo tipo (come): dipendono dalle "effettive condizioni d'uso" (programma musicale, ambiente)

Questo tipo di misure riguarda praticamente solo i trasduttori elettroacustici che risentono fortemente delle condizioni al contorno (pick-up, altoparlanti).

I segnali di test adatti a queste misure sono i segnali musicali o meglio tutti quei segnali che vengono processati dal cervello come segnali musicali.

 

Terzo tipo (chi): dipendono dal "soggetto ascoltatore"

Questo tipo di valutazioni riguarda gli aspetti più soggettivi della percezione. Su queste valutazioni si riflettono anche la cultura musicale, il senso estetico e lo stato psicofisico del soggetto (spesso anche della famiglia del soggetto), le sue paure ed insicurezze.  Qui intervengono considerazioni psicoacustiche e quindi statistiche. In alcuni casi è richiesto l’interveto dello psico terapeuta o di un esorcista..

 

Alla fine sono le valutazioni del terzo tipo che determinano il successo commerciale di un dispositivo ma se le misura del primo e secondo tipo non danno risultati almeno decenti, difficilmente un sistema suonerà convenientemente per un numero sufficiente di utenti. Non dimentichiamo che, da un punto di vista strettamente commerciale, lo scopo è realizzare un sistema che incontri il massimo consenso possibile all’interno del target prefissato. Per esempio un diffusore come la Opera Prima 2015 è pensato per chi dispone di poco spazio e l’estensione della gamma bassa è stata ottimizzata per un cabinet di 11 litri. Contemporaneamente la sensibilità è stata alzata a 91.5 dB consentendo il pilotaggio con amplificatori di potenza limitata. La Opera Prima 2015 non è evidentemente adatta a sonorizzare ambienti da 100 metri quadri ma può dire la sua in ambienti fino a 30 metri quadri.

 

Le effettive condizioni d’uso

 

Nelle “effettive condizioni d’uso” la catena di riproduzione è  installata nell’ambiente di ascolto, l’ascoltatore si trova nella sua abituale posizione seduto in poltrona (sedia, divano, ecc.) e l’impianto riproduce un brano musicale scelto dall’ascoltatore al livello SPL che più gli è consono.

È in queste condizioni che l’utente deve ottenere il risultato voluto.

Ciò non esime dal mettere in atto tutte le possibili ottimizzazioni (la posizione dei diffusori, la distanza di ascolto, un minimo di fonoassorbimento, l’equidistanza dai diffusori, ecc.).

Ci sono ambienti in cui non è possibile ottenere una riproduzione stereofonica decente indipendentemente dai dispositivi impiegati (per esempio se il tempo di riverberazione supera il secondo) In questi casi non serveun guru ma un buon paio di cuffie.

 

Misure sui diffusori acustici

 

Per un diffusore acustico (in generale per un trasduttore elettroacustico) l’ingresso  e l’uscita non sono  omogenei. Per il singolo diffusore

 

Ingresso

è un segnale in tensione monodimensionale (tensione in funzione del tempo)

uscita

è un campo acustico tridimensionale

 

Il campo acustico generato dal singolo diffusore nell’ambiente al massimo potrà assomigliare a quello di qualche strumento musicale, certamente non a tutti e ancor più certamente non a quello di più strumenti che suonano contemporaneamente. Quindi, pur non escludendo che in casi particolari si possa ottenere una riproduzione simile all’evento dal vivo, questo in generale non avvenire. Ci sono però aspetti della riproduzione che rendono la riproduzione stessa più simile all’evento reale (per esempio la bassa distorsione e l’elevata dinamica). Una riproduzione ad alta dinamica, anche se timbricamente non corretta, assomiglia di più all’evento reale di una riproduzione  timbricamente perfetta ma scarsamente dinamica. Ora la dinamica è una qualità della registrazione che viene correttamente riprodotta se l’amplificatore dispone di potenza sufficiente e i diffusori hanno la Forza e la Chiarezza sufficiente. Forza e Chiarezza sono attributi del suono cui corrispondono grandezze misurabili  (Forza -> massimo SPL, Chiarezza  -> waterfall).

 

Nota: in audiometria si considera “non udibile” un suono il cui livello sia 40 dB sotto allo stimolo. Questa affermazione non fa riferimento allo spettro del segnale,  alla separazione temporale e al fattore di cresta. Infatti, se due suoni risultano spettralmente separati, o separati nel tempo o con fattori di creta molto diversi, possono risultare distinguibili. Tale limite (40 dB sotto allo stimolo) corrisponde all’1% di distorsione.

Per quanto riguarda il riverbero, invece, un suono viene considerato estinto quando sta 60 dB sotto allo stimolo. Ne segue che conviene adottare come criterio di “non udibilità” quello applicato per la riverberazione. Questo però è un limite troppo stringente perché, nelle effettive condizioni d’uso, lo spettro del segnale riprodotto non è uniformemente distribuito. L’esperienza mostra che sistemi a tre vie con il woofer tagliato attorno a 200 Hz producono  ottimi risultati (in termini di fatica di ascolto) quando a distorsione armonica è inferiore allo 0,32% a partire da 80-100 Hz in su ma soprattutto in assenza di distorsione di quarta e quinta armonica (che devono restare inferiori allo 0.1%).

 

Torniamo ai tipi di misue (cosa, come , chi).

 

Primo tipo (cosa): Riguardano il diffusore come "strumento di trasduzione".

 

Appartengono a questo tipo: lo spostamento volumetrico, la risposta in frequenza in condizioni anecoiche, la dispersione, l'impedenza elettrica, Massimo SPL, MIL, MOL, risposta impulsiva, compressione termica e dinamica, distorsione, break up della membrana, eccesso di fase, cross-talk tra i filtri, effetto microfonico, vibrazioni del mobile, la diffrazione ai bordi,  ecc. Tutti i risultati di queste misure rispondono a condizioni necessarie ma non sufficienti.

 

Secondo tipo (come): dipendono dalle "effettive condizioni d'uso" (programma musicale, ambiente)

 

Per esempio la risposta in ambiente, il soundstage riprodotto (in larghezza e profondità), effetto stereofonico, rapporto tra suono diretto e riflesso, la Brillanza, ecc.

..

Un diffusore può essere ottimo con la musica da camera ma non adatto alla musica per organo. Perfetto a SPL moderati o in nearfield, ecc. Queste caratteristiche sono correlate alle misure precedenti ma un cattivo posizionamento in ambiente (o in un ambiente non adatto) o un programma musicale non adatto possono determinare un risultato anche molto negativo. Alcune misure devono essere condotte sulla coppia di diffusori, altre dipendono dalla disponibilità di una sorgente ausiliaria.

 

Terzo tipo (chi): dipendono dal "soggetto ascoltatore"

Tutti i difetti di un diffusore nelle  effettive condizioni d’uso confluiscono nella “fatica da ascolto” che è soggettiva. Per questa ragione si deve determinare dopo quanto tempo si manifesta la fatica da ascolto. L' altezza dell'immagine dipende da diversi fattori tra cui la forma del padiglione auricolare dell’ascoltatore. È del tutto normale che persone diverse percepiscano le sorgenti virtuali ad altezza diverse  Specie in ambienti con tempo di riverberazione breve (molto fono assorbenti, detti anche ambienti morti).

 

Misure sull’amplificatore

 

Primo tipo (cosa): Riguardano l’amplificatore come "strumento di riproduzione".

 

I dispositivi elettronici ricevono in ingresso un segnale elettrico e producono in uscita un segnale elettrico. Ingresso e uscita sono omogenei e monodimensionali quindi facilmente paragonabili. 

Per un amplificatore (e per le elettroniche in generale.) le misure dovrebbero essere solo quelle del primo tipo perché è possibile stabilire una condizione necessaria e sufficiente per ottenere la riproduzione perfetta del segnale. Matematicaqmente tale relazione si esprime come segue:

 

Vout (t+t0) = K vin(t)    indipendentemente dal carico  (1)

 

(qui non si parla di riproduzione sonora ma di riproduzione di segnali elettrici quindi si può applicare il criterio di riproduzione in forma del segnale).

 

L’ espressione (1) rappresenta la risposta di un dispositivo a fase minima con larghezza di banda infinita, distorsione nulla e tempo di propagazione pari a t0. Il tempo di propagazione è l’ unico parametro che non ha effetto sulla qualità della riproduzione (purché indipendente dalla frequenza). Se non si concorda sul fatto che “l’invarianza in forma indipendentemente dal carico” è la condizione necessaria e sufficiente per la riproduzione perfetta del segnale è inutile continuare perché questo toglie ogni scientificità alla materia.

Se l’alta fedeltà è magia o dogma religioso è meglio fare i propri acquisti direttamente a  Lourd.

 

I difetti comuni alle elettroniche sono il rumore, il cross-talk tra i canali e la distorsione. Considerando che il contributo spettrale di queste tre quantità sia identico la loro contemporanea presenza aumenterà di 9 dB il livello dello spettro indesiderato.

Quindi supponendo di volere un rapporto S/N di 100 dB dovremo fissare i limiti a –109 dB.

Un’altra fonte di difetti  dipende dalla  stabilità dell’ alimentazione, dallo slew rate e dall’erogazione di potenza.

 

Secondo tipo (come): dipendono dalle "effettive condizioni d'uso" (programma musicale, ambiente)

 

Un amplificatore reale eroga una corrente finita quindi le sue prestazioni dipendono dal carico che gli viene collegato. L’erogazione di corrente di uscita può risultare sufficiente o insufficiente e questo vale per qualsiasi elettronica (anche per i lettori CD).           

La condizione di invarianza in forma è  molto restrittiva nelle "effettive condizioni d'uso" ma può essere resa meno stringente, per esempio, accettando un polo a 200kHz nella risposta in frequenza, tollerando un certo rapporto segnale rumore e un certo  crosstalk tra i canali.

 

Terzo tipo (chi): dipendono dal "soggetto ascoltatore"

 

In letteratura si legge che se il pattern di distorsione ricalca il pattern di distorsione aurale di un soggetto quest’ultimo non percepisce anche tassi di distorsione elevati. Questo è, in parte, contraddetto dall’esperienza  Il gradimento del suono degli amplificatori a valvole non sembra legato ad  un particolare pattern spettrale della distorsione  ma al fatto che questa aumenti gradatamente con il livello del segnale (clipping morbibo o soft clipping). Quello che si può affermare è che, affinché la distorsione aumenti con il livello del segnale, la controreazione deve essere limitata o nulla. Certi fenomeni (“distorsione apparente” e la “potenza apparente”) riguardano sostanzialmente gli amplificatori a valvole poco retroazionati. Negli amplificatori allo stato solido una certa quantità di retroazione negativa è necessaria e sempre presente (anche quando si afferma che è nulla) a causa della non linearità intrinseca di mosfet e transistor.

 

Distorsione crescente con il livello del segnale

valvole

Clipping “morbido”

Poca o nulla controreazione

Fattore di smorzamento basso

Distorsione  che sale bruscamente in corrispondenza al clipping

Stato solido

Clipping “duro”

Retroreazione necessaria e sempre presente

Fattore di smorzamento alto

 

Anche se la controreazione non è presente è sempre presente la “degenerazione” (questa è una questione molto tecnica e non viene qui approfondita). Alcuni considerano la degenerazione come una forma di controreazione per cui si potrebbe dire che non esistono dispositivi non controreazionati.

 

Misure sul Lettore

 

Esistono lettori di supporti digitali e lettori di supporti analogici.

In generale per i lettori analogici valgono considerazioni analoghe a quelle fatte per i diffusori acustici mentre per i lettori digitali valgono considerazioni analoghe a quelle fatte per le elettroniche a stato solido.

Non ci dilungheremo su questo tranne osservare che, data la scarsa “trasportabilità” del giradischi e degli LP, si può ipotizzare che, in futuro, saranno preferiti i supporti immateriali (file audio) e quindi i lettori digitali.

 

Per qualsiasi lettore vale questa considerazione: in generale il contenuto del supporto è sconosciuto  (nel senso che non si sa con quale tecnica sia stata eseguita la registrazione e quali processi abbia subito). Fanno eccezione i rari casi in cui sia stato possibile assistere alla registrazione dal vivo. Va ricordato che alcuni programmi nascono “in studio” assemblando registrazioni avvenute in tempi diversi ed anche in luoghi diversi per cui un “evento originale” non c’è mai stato. Nel caso dei programmi digitali, la cosa certa è che il supporto contiene una successione di numeri. Quindi l’unica cosa che si può controllare è la corrispondenza tra il segnale numerico (in ingresso al lettore) ed il segnale elettrico all’uscita del lettore. Osserviamo che due convertitori D/A lineari che ricevono in ingresso lo stesso numero e producono in uscita la stessa tensione devono “suonare” allo stesso modo per definizione. Se ciò non avviene è perché le condizioni al contorno, a livello circuitale, sono diverse (per esempio filtri di ricostruzione diversi, sezione analogiche diverse, ecc.). In sostanza le non linearità sono diverse.

 

Se si osserva la figura che segue ci si rende conto di quanti passaggi sfuggano al controllo dell’utilizzatore finale e anche del progettista di lettori (compresi i lettori CD).

 

 

I lettori digitali (o i DAC) ricevono in ingresso una serie di numeri (che sono quello che sono) e producono come risposta in uscita una tensione analogica (perché l’amplificatore e i diffusori sono ancora dispositivi analogici). La corrispondenza tra:

 

-          la musica (segnale osservabile),

-          il segnale digitale presente nel supporto

-          il segnale elettrico analogico all’uscita dello stadio analogico del lettore (segnale osservato)

 

dipende, prima di tutto, dalla rigorosa applicazione del teorema di Shannon.

 

Diciamo subito che il teorema di Shannon non viene applicato in modo rigoroso.

 

Infatti tale teorema non prevede né la quantizzazione (numero finito di bit nella conversione A/D ) nel il troncamento (presente nei filtri anti alias e di ricostruzione). La Teoria Unificata dei Segnali Osservabili dimostra che non sussiste (nel mondo reale) la corrispondenza biunivoca tra il segnale osservabile (la musica) ed il segnale in uscita dal lettore (dopo la conversione D/A). Tale corrispondenza è impedita dal Principio di Heisemberg e viene ristabilita (come richiesto dalla teoria) introducendo l’insieme rosso (che amplia il concetto di segnale a una opportuna classe di segnali indistinguibili  secondo certi criteri)..

Ne segue che il segnale osservato (la musica) ed il segnale in uscita dal lettore sono “diversi” anche utilizzando i dispositivi più perfetti. Tale differenza è detta, impropriamente, “Rumore di Quantizzazione”. Il rumore di quantizzazione è parte del segnale digitale.  Fortunatamente esiste una soglia di udibilità anche per il rumore di quantizzazione.

Stabilito che il processo di conversione digitale introduce degli errori, per proseguire dobbiamo stabilire in quali condizioni tali errori non siano udibili. Se fossero sempre udibili la stessa idea di riproduzione ad alta fedeltà, con supporti digitali, perderebbe senso.

I programmi musicali possono essere quantizzati con

 

Bit si conversione

(quantizzazione)

Dinamica teorica massima

Dinamica con 35 dB di rumore ambientale

16 bit

90 dB di dinamica

55 dB

24 bit

138 dB

103 dB

32 bit

186 dB

151 dB

 

In un normale ambiente domestico, per sfruttare una dinamica di 90 dB (in presenza di 20 dB di rumore ambientale) si devono riprodurre un libello SPL di almeno 110 dB nel punto di ascolto (con picchi ancora più elevati). Non è poco ma  alla portata della tecnica attuale. Se il rumore ambientale aumenta a 35 dB il livello SPL  deve raggiungere 125 dB e questo è un problema perché tale livello supera la soglia del dolore ed è pericoloso per l’apparato uditivo. Comunque, in condizioni ambientali domestiche “normali”, la riproduzione di CD Audio ha soddisfatto, ad oggi, le esigenze di una buona percentuale di utilizzatori.

La dinamica dell’apparato uditivo (dalla soglia di udibilità alla soglia del dolore) vale teoricamente 120 dB: ai queli vanno tolti i 30 dB di amplificazione cocleare.  ne segue che non è possibile, per l’ uomo, fruttare una dinamica maggiore di 90 dB. Ne segue che la conversione tra  la conversione a 16 e a 24 bit sussiste un vantaggio mentre il passagio da 24 a 32 bit eccede le capacità di discriminazione dell’ampiezza dell’apparato uditivo umano. Ne segue anche che un convertitore a 24 o 32 bit soffre, eventualmente, solo per le conseguenza del troncamento. I problemi di troncamento possono essere evitati impiegando opportune tecniche.

Se non bastano i limiti fisiologici dell’apparato uditivo si possono considerare i limiti imposti dal rapporto segnale/rumore delle elettroniche. Quello che interessa notare è che, mentre con la conversione a 16 bit si possono manifestare dei limiti, questi si riducono all’inubibile già con 24 bit. La frequenza di campionamento è meno importante del numero di bit della conversione (vds Shannon). Certamente tanto più la frequenza di conversione è elevata e tanto più facile risulta sopprimerla.

 

Se il DAC è  stabile ed il suo comportamento ripetibile, ogni volta che si “suona” lo stesso programma la risposta del DAC è esattamente la stessa. Benché ogni dispositivo sia identico solo a sé stesso (Parmenide) non c’è  nulla che impedisca a due DAC  di suonare in modo indistinguibile (anche se strutturalmente diversi). Questo è ancora più probabile se anche i filtri di ricostruzione e la sezione analogica hanno la stessa funzione di trasferimento.

L’esperienza mostra (senza ombra di dubbio) che filtri  di ricostruzione diversi portano a risultati sonori diversi e distinguibili. Lo stesso vale per lo stadio analogico di uscita. Tuttavia se  due amplificatori hanno la stessa funzione di trasferimento, differiscono solo per le non linearità. Se le non linearità non sono udibili i due amplificatori diventano indistinguibili.

 

Per concludere un programma musicale convertito in un formato a 24 bit ha tutte le caratteristiche per essere potenzialmente indistinguibile dal segnale osservato (per l’ascoltatore). La causa delle eventuali differenza tra lettori diversi va ricercata del filtro di ricostruzione, nello stadio analogico di uscita del lettore, nella ripetibilità della funzione di conversione. Se la conversione non è ripetibile, lo stesso brano, suonato in momenti diversi, suona “diverso”.

 

Esistono programmi che eseguono la conversione da un tipo di file ad un altro. Per esempio un file a 32 bit può essere trasformato in un file a 24 bit. Vale la seguente regola generale:

 

“qualsiasi conversione di formato al massimo produce un nuovo file con lo stesso livello qualitativo del file originale (stesso numero di informazioni). In nessun caso un cambio di formato può migliorare la qualità (il numero di informazioni) contenuto in una registrazione”.

 

Può però succedere un’altra cosa. Supponiamo che un brano sia codificato in FLAC e che il programma che legge il FLAC contenga un errore per cui “suona male”. In questo caso, convertendo il file da FLAC a WAVE e riproducendolo con un programma che converte adeguatamente il formato WAVE, la qualità della riproduzione  migliora. La colpa non è del formato FLAC e la conversione non ha migliorato la qualità del supporto: la colpa è del programma di lettura che non sa leggere correttamente il formato FLAC.

 

C’è anche una seconda possibilità: supponiamo di disporre di un programma codificato a 16 bit  e 44.1kHz.

Lo sottoponiamo ad una conversione che raddoppia la frequenza di campionamento pasandoa 88.2  kHz. Questa conversione non altera in alcun modo le informazioni contenute nel programma musicale.

Ora ascoltiamo questo file a 88.2kHz che, per essere riprodotto, passerà attraverso un filtro di ricostruzione con frequenza di transizione non più a 20kHz ma a 40 kHz. Tale filtro, a frequenza più elevata, non introduce un ritardo di gruppo all’estremo della banda audio e quindi il risultato potrebbe essere qualitativamente migliore. In questo caso la conversione non  ha modificato le informazioni ma ha consentito di riprodurle con errori inferiori.