Udibilità della distorsione

 

di Mario Bon

(5 novembre 2012, riorganizzato, integrato, rivisto e corretto 16 gennaio 2013, ultima revisione 13 febbraio 2017)

 

 

La alterazione o distorsione della forma del segnale può interessare intervalli di tempo molto brevi (per esempio brevi sovramodulazioni o clipping della durata di micro o millisecondi). Una sovramodulazione o un clipping della durata paragonabile al tempo di integrazione dell’orecchio (35-50-100 millisecondi) viene percepita mentre, se la durata scende sotto i 15-20 millisecondi, si entra nella regione dove l’apparato uditivo è sensibile all’energia e su tempi troppo brevi per il riconoscimento del timbro. Sovramodulazioni isolate nell’ordine di qualche millisecondo non possano essere percepite (se non in un ascolto ripetuto in tempi ravvicinati). 

 

Questo porta a distinguere una distorsione “stazionaria” dalla “distorsione di forma”

Entrambe sono correlate alla fatica da ascolto ma la “distorsione di forma”  è molto più tollerabile della prima.

 

 

Distorsione e fattore di cresta dello stimolo

 

Le effettive condizioni d’uso di un sistema di altoparlanti si descrivono partendo dal programma musicale riprodotto. Il fattore di cresta dei segnali contenuti nei CD audio assume valori che vanno da 3 a 30 ma una certa qualità, statisticamente, si riscontra a partire da 5-6 in su (figura 6.9). Per contro è abitudine misurare la distorsione con stimoli a basso valore di cresta (da 1.4 a poco più di  3) ed a livelli SPL  elevati.

Premesso che è inutile sforzarsi di riprodurre fedelmente programmi musicali con fattore di cresta inferiori a 3 (perché statisticamente eccessivamente compressi e/o sovramodulati) chi scrive è convinto che le differenze tra un diffusore e l’altro vadano ricercate nella riproduzione dei livelli SPL più bassi. Questa affermazione è giustificata dalla ASDA della figura che segue: qui il segnale soggiorna per undici quindicesimi della sua storia sotto al 3% della Massima Modulazione Relativa (MMR) e supera il 25% della MMR per meno di due secondi (complessivamente tra canale destro e sinistro). Se ci sono differenze tra due dispositivi esse appariranno più evidenti là dove il segnale passa la maggior parte del tempo. I brevi picchi del segnale musicale (attorno a qualche milli secondo) anche se non sono riprodotti fedelmente, producono una distorsione “di forma” di brevissima durata che il sistema uditivo tollera facilmente (scambiandola con un incremento di loudness soggettivo o ignorandola del tutto).  

 

 

 

 

ASDA di un brano per pianoforte (Beethoven) Il fattore di cresta di questa traccia vale  circa 24 (27.6 dB). La colonna di numeri a sinistra (con le barre colorate) rappresenta il numero di volte in cui il segnale musicale ha superato la  soglia indicata nelle altre due colonne (in % rispetto alla Massima Modulazione Relativa). L’85% della MMR viene superato complessivamente da 21 campioni pari 476 microsecondi (meno di mezzo millisecondo rispetto alla durata dell’intero brano). 

 

 

 

La prossima tabella mostra quanto diminuisce la potenza continua assorbita dal sistema di altoparlanti all’aumentare del fattore di cresta del segnale musicale. Questa tabella  si riferisce ad un amplificatore da 512 Watt RMS ma la potenza RMS, dissipata sul carico, scende a poco più di un Watt quando il fattore di cresta raggiunge 28.28. La tensione di picco sul carico rimane invece costante: nelle effettive condizione d’uso, con programmi musicali decenti, il diffusore acustico dissipa potenze continue limitate.

  

 

Fattore di Cresta

Watt Continui dissipati su un carico da 8 ohm (circa)

Tensione di picco

sul carico

in Volt

1.414 (sinusoide)

512

90.5

2

256

90.5

2.828

128

90.5

4

64

90.5

5.656

32

90.5

8

16

90.5

11.312

8 

90.5

16

4

90.5

22.62

2

90.5

28.28

1.28

90.5

32

1

90.5

Tabella: potenza dissipata sul carico dall’amplificatore in funzione del fattore di cresta del segnale.

 

Fattore di cresta rilevato per 612 tracce estratte da CD audio. Circa 450 tracce su 612 presentano fattore di cresta maggiore di 6, un centinaio di tracce supera il valore 15, una cinquantina supera il 20.

Ai fini del corretto dimensionamento di diffusori e amplificatore interessano i valori  massimi che caratterizzano le registrazioni migliori. I valori medi sono fuorvianti. Si possono invece fare delle considerazioni per tenere conto della tollerabilità della distorsione di forma.

 

 

Percezione della distorsione

 

Percepiamo la distorsione attraverso la Fatica da Ascolto. La Fatica da Ascolto si misura con un fonometro e un orologio:

 

-          il fonometro registra il livello SPL nel punto di ascolto.

-          l’orologio misura dopo quanto tempo interviene la Fatica da Ascolto nell’ascoltatore.

 

Il risultato dipende dalla catena di riproduzione, dal livello SPL, dall’ambiente ma anche dalla predisposizione dell’ascoltatore. La misura della distorsione non lineare misura la Fatica da Ascolto in modo indiretto. Non sembrerebbe difficile stabilire quale tasso di distorsione consenta di raggiungere i limiti “medi”  di Fatica da Ascolto dopo un periodo sufficientemente lungo. Purtroppo la misura della distorsione è una misura multidimensionale e non è possibile ricavare una scala di valori di riferimento (bassa, media, alta). Tanto per fare un esempio la distorsione armonica prodotta da un sistema a due vie non può esser valutata allo stesso modo della distorsione prodotta da un sistema a tre vie (le misure con stimoli multitono superano questa limitazione). Altra complicazione deriva dalla distorsione aurale (che costringe a valutare anche come aumenta la distorsione con il livello SPL riprodotto). 

 

Questa espressione considera separatamente il contributo della distorsione stazionaria e della distorsione di forma alla fatica da ascolto. La distorsione stazionaria dà il suo contributo durante tutto l’ascolto. La distorsione di forma riguarda i picchi di segnale (che si presentano in numero finito n) e il cui contributo viene pesato da una funzione che ne attenua l’effetto con il tempo.

Mentre la distorsione è una misura multidimensionale, la Fatica da Ascolto è una grandezza monodimensionale per la quale è possibile stabilire una scala di valutazione (bassa, media, alta).

 

Udibilità e tollerabilità della distorsione

  

Per quanto riguarda la distorsione si devono distinguere due soglie: la soglia di udibilità e la soglia di tollerabilità entrambi soggettive.

 

JDD

Just Detectible Distortion

Significa “Distorsione appena percepibile” misura la soglia di udibilità della distorsione, la minima distorsione percepibile

JTD:

Just Tolerable Distortion.

Significa “Distorsione appena tollerabile” o soglia tollerabile di distorsione (per un intervallo di tempo specificato). Definito da chi scrive.

 

La JDD (Just Detectible Distortion) o Distorsione Appena Percepibile fu Introdotta da Moir nel 1981. (J. Moir, “Just Detectable Distortion Levels,”Wireless World, vol. 87, pp. 32 –35 (1981 Feb.).). Le conclusioni di Moir sono molto interessanti e soprattutto sensate:

 

La misura di distorsione armonica ha poco a che vedere con la qualità dell’ascolto (sostanzialmente è così:la sola distorsione armonica al massimo produca una alterazione del timbro)

La JDD è legata al fattore di cresta del segnale dell’intervallo considerato e alla durata dei picchi

La JDD per clipping di tone burst di durata di 20 millisecondi e pari allo 0.25%

La JDD per clipping di tone burst di durata di  4 millisecondi e pari al 10.00%

la distorsione prodotta su una successione di brevi picchi è meno importante della distorsione di un singolo picco di durata pari alla somma dei brevi picchi.

la distorsione di forma a bassa frequenza è meno importante della distorsione di forma alle medie frequenze  (vero per un diffusore a più di 2 vie)

La distorsione di ordine dispari è più percepibile della distorsione di ordine pari (anarmonia)

 

Le considerazioni sulla percezione della distorsione di armonica pari valgono per i toni puri. In regime musicale quando è presente distorsione armonica è sempre presente anche l’intermodulazione.  Qualsiasi dispositivo, prima o poi, produce distorsione di ordine dispari (clipping, saturazione).

Alla JDD e JTD si aggiunge la

 

JND.

Just Noticeable Difference

significa “minima differenza percepibile” per esempio la minima differenza percepibile di ampiezza. In generale è il più piccolo cambiamento nei parametri di uno stimolo (frequenza, intensità, distorsione, durata…) che può essere riconosciuto da un ascoltatore (con una probabilità del 71%). Vedere legge di Weber.

Ha una componente stazionaria e una componente di forma.

 

Se un diffusore produce un tasso di distorsione inferiore alla soglia di udibilità è come se la distorsione fosse nulla: un tale diffusore, se non sussistono altre cause, può essere ascoltato per molte ore senza provocare fatica da ascolto. Il limite temporale per la valutazione della fatica da ascolto va fissato in almeno 4 ore.

Per la soglia di tollerabilità il discorso è più delicato: un diffusore può apparire buono nei primi dieci minuti di ascolto ma indurre affaticamento dopo un’ora. E’ complicato “imporre” che un test di ascolto duri delle ore ... per questo servono le misure. Una distorsione tollerabile è comunque una distorsione presente e udibile e costringe il cervello ad un lavoro supplementare per percepire il “messaggio sonoro” in modo corretto. Ciò rende l’ascolto più o meno affaticante.

Una distorsione tollerata è quella che interviene a “stondare“ i picchi del segnale musicale alterandone la forma per brevi istanti nell’ordine dei millisecondi (la distorsione di forma). I test di ascolto, con tracce ad elevato fattore di cresta troncate al 50 ed al 70% della Massima Modulazione Relativa dicono che questa  distorsione di forma è ottimamente tollerata o inudibile. La distorsione di forma può dipendere da quattro cause (anche contemporanee):

 

-          sovramodulazioni presenti nella registrazione

-          clipping dell’amplificatore

-          superamento dei limiti di escursione degli altoparlanti

-          compressione termica  e/o meccanica istantanea

 

Dato che realizzare un sistema di altoparlanti con una distorsione dell’1 o dello 0.1%  comporta  costi ben diversi, è fondamentale conoscere i limiti di udibilità e di tollerabilità della distorsione come pure definire delle misure che consentano di addivenire ad un risultato oggettivo in breve tempo (minuti non ore). I limiti di udibilità della distorsione sono stati indagati da molti ricercatori con diverse metodologie ed alterne fortune.

 

Bryan e Parbrook sostengono che le componenti di distorsione superiore al terzo ordine diventano udibili quando raggiungono lo 0.05% (–66 dB). C’è comunque chi indica lo 0.02%  per  ogni ordine di armonica.

La norma DIN raccomanda di misurare la distorsione armonica di un diffusore acustico quando questo produce 96 dB SPL ad un metro e fissa due limiti: il 3% (fino a 1000 Hz)  e l’1%  (da 2000 Hz in su). La rivista statunitense Stereophile produce ampi test strumentali che non comprendono (se non in casi eccezionali) le misure di distorsione (pur disponendo degli strumenti per farlo). Al contrario la rivista italiana Audio Review misura: distorsione armonica a 90 dB, MIL, MIL, TND e compressione dinamica (5 misure di non linearità). Ne segue che per capire come suona un diffusore si devono leggere due riviste. Per avere un’idea completa bisogna leggere anche la rivista LP (Germania) che misura la differenza tra il diffusore destro e sinistro.

Ricapitolando si passa da chi afferma che la distorsione è udibile anche se è 6 dB sotto un suono considerato estinto (vds tempo di riverbero T60) a chi non esegue alcuna misura di distorsione anche se potrebbe fino a chi ne esegue cinque.

 

Rimaniamo un momento sui test di Stereophile perché questa rivista produce test molto ricchi di grafici tra cui la rilevazione delle vibrazioni dei cabinet. Tutti i test si trovano in rete e sono gratuitamente consultabili (http://www.stereophile.com/floorloudspeakers/). John Atkinson, che esegue le misure, invece di misurare la distorsione, preferisce regolare il volume al livello più adatto (a volte basta abbassare un poco il volume … altre volte è meglio spegnere tutto). Questo presuppone che:

 

-          la distorsione sia comunque contenuta

-          la distorsione aumenti con il livello SPL riprodotto

-          il test duri abbastanza  a lungo per produrre, se è il caso, la fatica di ascolto

 

Il giudizio finale dipende dalla qualità della registrazione e dalle condizioni al contorno (lettore, amplificatore, rumore ambientale, durata del test….) con il rischio di confondere l’udibilità della distorsione con la tollerabilità della fatica da ascolto (in particolare se il test di ascolto è breve). Su questa stessa posizione si ritrova anche la rivista  SUONO (che però ha previsto di commentare esplicitamente il livello e la dinamica riproducibile). Nessuno però specifica la durata dei test di ascolto che è una informazione fondamentale perché la fatica di ascolto “aumenta con il tempo”. Se un diffusore ottimo o pessimo dimostra immediatamente le proprie qualità, un diffusore di classe media potrebbe richiedere un test di ascolto molto più lungo: un test di ascolto breve non può che sottostimare la fatica da ascolto. In alternativa basta fare un paio di misure distorsione integrale.

 

Soglie di udibilità della distorsione

 

Per prima cosa dobbiamo dire che, per i sistemi di altoparlanti non è possibile misurare la distorsione utilizzando direttamente segnali musicali: le misure di RD non sono applicabili ai sistemi di altoparlanti.

Si tratta quindi di selezionare uno stimolo che porti il diffusore, per quanto possibile, in una situazione vicina alle effettive condizioni d’uso.

Diciamo che oggi sono di moda gli stimoli multitono. Il “suono” dello stimolo multitono è quello che si ottiene pigiando contemporaneamente tutti i tasti della tastiera di un organo (impostando il timbro del flauto).

 

Definire un metodo di misura della distorsione non basta: si devono anche definire i limiti di udibilità della distorsione misurata con la nuova procedura. Per farlo utilizziamo i giudizi soggettivi espressi nei test di ascolto dei diffusori commerciali: esistono diffusori unanimemente considerati dei riferimenti di qualità sonora per i quali non si segnala alcuna fatica da ascolto: se ne deduce che la distorsione prodotta da questi diffusori è inferiore al limite di udibilità. Tra questi diffusori figurano, per esempio, le QUAD ESL 2905 e le B&W 801D.

Formiamo due classi

 

-          La classe 1 contiene tutti i diffusori che soggettivamente non producono distorsione udibile

-          La classe 2 contiene tutti gli altri

 

A questo punto il limite di udibilità della distorsione corrisponde ad un ipotetico diffusore la cui distorsione è troppo alta per la classe 1 e troppo bassa per la classe 2 (elemento di separazione tra due classi contigue).

 

Il limite di udibilità della distorsione andrà delineandosi con sempre maggiore precisione nel tempo. Nulla vieta di dividere ulteriormente la classe 2 in sottoclassi in base a criteri di tollerabilità.

 

Evidentemente la condizione ideale è la completa assenza di distorsione.

Tecnicamente la condizione necessaria e sufficiente affinché la distorsione armonica sia nulla è che sia nulla la distorsione per intermodulazione (al netto della distorsione Doppler per gli altoparlanti). Dove c’è distorsione armonica c’è sempre intermodulazione e l’intermodulazione è sempre più fastidiosa della sola distorsione armonica.

 

La misura della distorsione armonica è molto diretta: lo stimolo è una sinusoide e i prodotti di distorsione sono le armoniche dello stimolo (2^, 3^, 4^ armonica, eccetera). L’entità della distorsione armonica dipende solo dall’ampiezza dello stimolo. È opportuno valutare anche la distorsione sub-armonica. A volte una misura di distorsione appare non conforme alla performance dell’altoparlante: la colpa potrebbe essere della distorsione sub-armonica la quale ha una energia minima di soglia e quindi va cercata in modo sistematico..

La distorsione per intermodulazione dipende dalla ampiezza e dalla forma dello stimolo: il risultato cambia sia con il contenuto spettrale dello stimolo che con la sua ampiezza.

 

Dato che è molto più agevole misurare la distorsione armonica, poniamoci questa domanda: nota la distorsione armonica è possibile prevedere il tasso di distorsione di intermodulazione? Meglio ancora: è possibile fissare dei limiti alla distorsione armonica che garantiscano la non udibilità della distorsione di intermodulazione? Ciò permetterebbe di ottenere una previsione certa eseguendo delle misure  standardizzate e facilmente ripetibili.

 

La cosa, in linea teorica, è possibile ma richiede una mole enorme di informazioni che la rende, di fatto, impraticabile. Tuttavia l’esperienza mostra che:

 

-          se la distorsione armonica di 2° e 3° ordine è contenuta (< 0.32%)

-          se la distorsione delle armoniche superiori al terzo ordine è nulla (< 0.1%)

 

allora anche l’intermodulazione è bassa.  In queste condizioni il tasso di distorsione è direttamente proporzionale all’ampiezza dello stimolo applicato. Ne segue che in regime di segnali “non troppo grandi”, dimezzando l'ampiezza dello stimolo ci si può aspettare che la distorsione si riduca attorno alla metà.

 

Distorsione e numero di altoparlanti (array)

 

Per quanto appena detto nel riquadro, dato un altoparlante che produce solo distorsione di 2^ e 3^ armonica,

ponendo due altoparlanti uguali in serie si otterrà, a parità di SPL prodotto,  un tasso di distorsione pari alla metà (circa) rispetto al singolo altoparlante. Allo stesso tempo, a parità di SPL prodotto, la banda passante utile risulterà estesa verso il basso del 40% mentre ci sarà una riduzione della dispersione verso le alte frequenze a causa della presenza di due sorgenti (interferenza).

Se si usano 4 altoparlanti uguali, per esempio in serie_parallelo, e sempre a parità di SPL, la distorsione risulterà ridotta ad un quarto e la banda passante utile risulterà estesa di una ottava verso il basso.

 

Numero di altoparlanti

Tasso di distorsione

Freq. Minima

SPL

1

1% a 100 Hz

100 Hz

90 dB a 100 Hz

4

0.25% a 100 Hz

50 Hz

90 dB a  50 Hz

16

0.0625% a 100 Hz

25 Hz

90 dB a  25 hz

64

0.015% a 100 Hz

12.5 Hz

90 dB a 12.5 Hz

 

Se da una parte l’incremento del numero di altoparlanti comporta, con l’aumento dello spostamento volumetrico, l’estensione della banda passante a parità di SPL e una importante riduzione della distorsione, dall’altra comporta l’aumento della dimensione della sorgente ed il conseguente aumento della direttività. Entro certi limiti, ovvero con un numero limitato di altoparlanti, si possono implementare i filtri passa-basso progressivi. Ma se la dimensione totale della sorgente comporta ritardi nell’ordine del millisecondo ci potrebbero essere seri problemi nella risposta impulsiva e nella determinazione della dimensione della sorgente virtuale. Non vanno tuttavia sottovalutati gli aspetti psicoacustici. Per esempio una distorsione estremamente bassa potrebbe sortire un effetto così “benefico” da sovrastare altri difetti. Se così non fosse sarebbe difficile giustificare perché le sorgenti estese (come i pannelli elettrostatici) siano tanto apprezzati (specie per la riproduzione della gamma medio alta).

 

Distorsione di fase

Vedere la voce dedicata

 

 

Conclusioni

Per concludere la distorsione è prevedibile matematicamente ma il processo è antieconomico. L’esperienza maturata con le misure di distorsione armonica permette di stimare la distorsione di intermodulazione ma l’utente finale ha bisogno di un risultato certo che stabilisca se il tal diffusore è in grado di sonorizzare il suo ambiente, con il suo genere musicale preferito e con un tasso di distorsione adeguatamente basso.  La misura di “Distorsione Integrale” serve proprio a questo.

 

Segue una tabella riassuntiva dei risultati ottenuti in tempi diversi da diversi ricercatori.

 

 Anno

Autore e data dello studio

Tema della Ricerca

Conclusioni

Note

1937

Von Braunmühl & Weber

Sensibilità alla Distorsione in diverse bande di frequenza

1% - 2% per frequenze maggiori di circa 500 Hz

A frequenze più basse la JDD può aumentare di molto

1940

Harry F Olson

Just detectible distortion (JDD) levels

JDD pari a  0.7% con test tra 40 Hz a 14 kHz

Riducendo la banda passante a  4 kHz la JDD raddoppia

1950

D.E.L Shorter

Qualità del suono di sistemi con tasso di distorsione nota

Distorsione percepibile da 0.8% a 1.3%

Moltiplicando l’ampiezza delle armoniche per  n^2/4 (n = ordine) prima di eseguire l’RMS produce miglior correlazione tra la misura oggettiva e la sensazione soggettiva

1960

M. E. Bryan & H. D. Parbrook

JDD dalla  2^ alla 8^ armonica in presenza di una fondamentale a 360 Hz  (armoniche a 720, 1080,1440)

Distorsione in % in ordinata

La Tabella a destra mostra la distorsione JDD in % fino alla 8^ armonica in funzione del livello SPL in dB della fondamentale.

Segnale sinusoidale monofonico in cuffia.

Questo esperimento è molto citato perché indica percentuali di distorsione bassissime.

1979

P.A Fryer

Test di ascolto

per distorsione

di intermodulazione

2% - 4% di distorsione udibile con pianoforte, 5% con altri segnali

Programmi test distorti usando prodotti

di distorsione di intermodulazione (IM) del primo ordine

1981

James Moir

Determinazione del JDD

“JDD non può essere minore dell’ 1%”

Assume la distorsione non-lineare come causa principale. Il livello JDD si abbassa quando l’ascoltatore impara a riconoscere la distorsione

 

Fabrizio Calabrese

 

1% di distorsione su picchi di 130 dB

 

 

Renato Giussani

 

3% su programma musicale

 

2009

Mario Bon

Determinazione della JDD per la DI

Meno dello 0.32% di 2^ e 3^ . Assente per gli ordini superiori. DI minore dell’1%

La distorsione non lineare è più importante a basso livello di segnale, la sovramodulazione dei picchi brevi è tollerata (distorsione di forma).

Tabella tratta da Human Hearing - Distortion Audibility Part 3 di Mark Sanfilipo (e integrata). Tradotta e ordinata per anno. Per quanto riguarda i dati di Bryan & Parbrook (che nel 1960 disponevano di cuffie con distorsione migliore dello 0.05%) deve considerare che l’ampiezza della fondamentale è molto bassa (al massimo 76 dB) e la frequenza di 360 Hz cade in una zona di bassa sensibilità mentre le armoniche cadono a frequenze dove l’orecchio è più sensibile (tipico test organizzato in modo discutibile). Per chi scrive, i dati di Bryan & Parbrook non sono affidabili e sono un esempio di quanto sia necessario valutare accuratamente le condizioni al contorno delle misure con spirito critico. Non tutto quello che si legge in letteratura è corretto.