Udbilità della Distorsione di Fase (nei diffusori acustici)

di Mario Bon

corretto 13 febbraio 2013, e ulteriormente l’ 1 giugno 2015, ultima 9 gennaio 2018,19 giugno 2019

 

Si tratta di capire se, o in quali condizioni, l’ eccesso di fase che caratterizza un diffusore acustico sia udibile.

Notiamo subito che l’eccesso di fase è una caratteristica del secondo ordine che diventa evidente quando altri difetti (quali il calore e la fatica da ascolto) sono molto bassi. Cominciamo dai casi più semplici:

 

fase assoluta (*)

amplificatore invertente

Non è udibile.  Resta il fatto che la fase assoluta della sorgente non è nota.

fase relativa

coppia di diffusori stereo con fase opposta

Il canale centrale non è al centro, carenza di bassi -> sicuramente udibile oltre che facilmente misurabile

fase relativa

diffusore a due vie con un altoparlante (tweeter) con fase invertita

Interferenza distruttiva sull’asse di radiazione -> udibile (meno udibile se gli altoparlanti sono in quadratura). Si accompagna ad alterazioni della risposta in frequenza. Facilmente misurabile. È tanto più udibile quanto più l’incrocio è basso.

 

Gli esempi riportati nella tabella qui sopra, più che distorsione di fase, rappresentano veri e propri errori di cablaggio o di connessione. 

 

(*) Udibilità di fase assoluta.

Un woofer è caratterizzato dal massimo spostamento lineare e dal massimo spostamento meccanico (della bobina mobile). Il massimo spostamento lineare,  in corrispondenza di transitori violenti, viene spesso superato (distorsione di forma). In un sistema a tre vie il superamento dei limiti di spostamento lineare viene notato all’ascolto solo se accompagnato da effetti udibili (il “bump” del raggiungimento di fondo corsa, forte distorsione…). Per ampie escursioni il moto della bobina mobile può essere fortemente asimmetrico e questo difetto può rendere riconoscibile l’inversione della fase assoluta con segnali caratterizzati da un forte picco positivo o negativo. Ecco perché si dice che la fase assoluta diventa riconoscibile per livelli SPL elevati e/o in presenza di forte distorsione. In effetti ad alti livelli SPL la distorsione diventa anche molto elevata (e riconoscibile).

 

Gli amplificatori e le elettroniche analogiche in generale (almeno con piccoli segnali) sono dispositivi a fase minima. Ammesso che sia possibile eliminare la diffrazione ai bordi, i diffusori acustici multivia possono al massimo ottenere la condizione di fase minima solo lungo certe particolari direzioni e su zone limitate di spazio (cosa vera per qualsiasi sorgente estesa). In un diffusore a tre vie con tre altoparlanti, per esempio, il suono percorre almeno tre “canali” perché parte da tre altoparlanti diversi (a distanza diversa dal punto di ascolto). Anche se l’altoparlante fosse unico e a larga banda ci sarebbero comunque gli effetti della diffrazione ai bordi (che creano delle sorgenti secondarie che irradiano anche in direzione del suono diretto). Qualsiasi altoparlante a cono (anche a larga banda) anche se montato a “filo del muro” non potrebbe risultare a fase minima a causa della profondità del cono e per la diffrazione ai bordi: il centro acustico virtuale (alle frequenze alte) “arretra” verso il centro del cono e lo stesso bordo esterno dell’altoparlante provoca diffrazione (diventa una sorgente a fase mista). In linea di principio, per realizzare  un diffusore a fase minima, si dovrebbe utilizzare un unico altoparlante piatto (e anche di piccolo diametro) “montato a filo” di uno schermo infinito senza alcun tipo di sporgenza. Ottenere la condizione di fase minima con un diffusore acustico reale è praticamente impossibile (segnatamente a causa della diffrazione ai bordi) ma questo non esclude che tale condizione possa essere approssimata (almeno nel range di frequenze dove l’orecchio è sensibile all' eccesso di fase).

 

Tra i primi a pronunciarsi sulla udibilità della fase troviamo G. Simon Ohm (Erlangen 1789-Monaco di Baviera 1854) secondo il quale:  “le rotazioni di fase non sono udibili”. Questa affermazione va contestualizzata in quel periodo storico  tenendo conto delle conoscenze e delle risorse tecniche dell’epoca. Nel tempo, sulla udibilità della fase, si sono delineate due scuole di pensiero una a favore (Dahlquist, B&K, Schroeder, e altri) e contro (Klipsh, Tannoy, Bose, e altri). Probabilmente questa diversità di vedute aveva anche delle giustificazioni di tipo commerciale.

 

Box 2

Esperimento di Schroeder: randomizzando le relazioni relative di fase delle componenti spettrali di un impulso si ottiene un rumore casuale. Questi due stimoli suonano in modo completamente diverso anche se hanno lo stesso spettro di potenza. Per Schroeder ciò dimostra che l’ alterazione delle relazioni di fase  è udibile. A parte il fatto che l’impulso non è un suono udibile nel senso comune del termine (non ha timbro riconoscibile) questi due segnali non differiscono solo per la fase relative delle componenti spettrali ma anche per la durata: vanno classificati come due suoni diversi che incidentalmente hanno lo stesso spettro di potenza. Sempre mantenendo lo stesso spettro si potrebbe costruire  lo sweep lineare (o chirp lineare). Le argomentazioni di Schroeder a sostegno della udibilità della fase sono troppo superficiali.

 

 

Quando due trasduttori non sono allineati temporalmente possono produrre una risposta in frequenza piatta (in regime stazionario) ma presenteranno sempre due picchi distinti nella risposta nel tempo (e nella ETC).

 

In questa situazione si vedono alterazioni anche nella risposta al burst e nella waterfall.

Dato che le due sorgenti generano interferenza è possibile notare una differenza nella risposta in frequenza rilevata in pulti diversi dello spazio.

 

Per esempio si può rilevare la risposta in frequenza in asse della tromba ed in asse del woofer in campo semivicino (per esempio 30-50 cm di distanza).

 

A 4 metri di distanza dalla sorgente in un ambiente mediamente riverberate tutti questi difetti vengono coperti dalla riverberazione.

 

Box 3

da “Loudspeaker Phase Measurements transient response and audible quality” di H. Moller   – B&K Application Note – presentata anche alla 48^ Convention dell’ AES in California.

Esempio di allineamento dei centri acustici con trasduttori a tromba.

Allineando i centri acustici la riduzione dell’eccesso di fase è evidente.

 

Oggi, in commercio, si trovano sia diffusori che presentano:

-          due picchi distinti nella misura di ETC;

-          altri con gli altoparlanti disposti su piani sfalsati per allineare i centri acustici di emissione;

-          diffusori con gli altoparlanti disposti su pannello frontale piatto;

-          diffusori con complicati sistemi di allineamento temporale degli altoparlanti (Focal, Wilson, ecc.).

 

Nel 1976, l’ing. Gandolfi con un interessante articolo (pubblicato da SUONO) giungeva a queste conclusioni:

 

“.... la qualità di riproduzione del diffusore rimane sostanzialmente inalterata anche disponendo il tweeter in fase e, solo durante l'ascolto di alcuni segnali artificiali è parso ad alcuni ascoltatori di avvertire una qualche differenza di riproduzione tra i due sistemi.....in un diffusore acustico una corretta risposta in fase provoca sempre un miglioramento della risposta ai segnali transitori che però diventa evidente all'ascolto solo dopo che sono state annullate o per lo meno fortemente ridotte tutte le altre forme di distorsione.”

 

In generale c’era il sospetto che la risposta in fase avesse un peso ma mancavano evidenze sperimentali decisive a favore o contro. Sono passati 35 anni. Oggi conosciamo l’effetto delle prime riflessioni sulla qualità della musica riprodotta e lo sviluppo di control room sempre più sofisticate ha permesso di comprendere meglio alcuni fenomeni. Le control room (ambienti dove vengono controllate le registrazioni) sono progettate in modo da:

 

-          evitare l’effetto comb filter (filtro a pettine)

-          evitare lo slap echo (o glare)

-          evitare le onde stazionari (modi normali dell’ambiente)

-          ottenere un intervallo temporale sufficiente tra l’arrivo del suono diretto e del suono riflesso (ITG)

 

In sostanza (fin dai tempi delle control room di tipo LEDE) all’operatore devono arrivare i seguenti stimoli in quest’ordine:

 

-          il suono diretto

-          la prima riflessione contenuta nella registrazione

-          il suono riverberato dall’ambiente

 

Si noti che la prima riflessione contenuta nella registrazione deve arrivare prima delle riflessioni generate dall'ambiente. Questo significa che l'ITG dell'ambiente deve essere maggiore dell'ITG dell'ambiente ove è avvenuta la registrazione. Questo, in ambiente domestico, è molto difficile da ottenere perché significherebbe rendere l'ambiente altamente fonoassorbente.

Inoltre il (poco) suono riflesso, presente nella control room, viene diffuso. La stessa filosofia sta alla base delle control room tipo FRZ (Free Reflection Zone) e sostanzialmente anche in quelle tipo ESS e Natural Room (anche se con qualche variante non secondaria). In un normale ambiente domestico l’intervallo che intercorre tra l’arrivo del suono diretto e la sua  prima riflessione è molto ridotto (minore dell’ITG tipico della registrazione) e può causare l’allargamento della sorgente virtuale (cosa che alcuni giudicano positivamente). E’ noto a tutti che un ambiente troppo riverberante è inadatto all’ascolto (tanto da produrre fatica da ascolto) ed è altrettanto noto che i diffusori “suonano meglio” se posizionati lontano dalle pareti (risposta sui bassi permettendo). Allontanare i diffusori dalle pareti aumenta lo ITG e diminuiscono le riflessioni laterali. Altro modo per ridurre le riflessioni laterali è utilizzare diffusori con radiazione a dipolo.

 

In sostanza:

 

oggi è appurato che la distorsione di fase diventa udibile solo riducendo il tempo di riverberazione dell’ambiente (o nell’ascolto in cuffia)

 

detto in altre parole (forse più correttamente)

 

è appurato che i transitori vengono mascherati dalle riflessioni dell’ambiente (in particolare dalla prime riflessioni laterali coerenti).

 

In realtà non è un problema di tempo di riverberazione ma di ITG e di correlazione tra il suono diretto e la sua prima riflessione. Riducendo la correlazione tra suono diretto e la sua prima riflessione laterale si migliora decisamente la qualità della riproduzione (si riduce l'effetto comb-filter che rende riconoscibile la presenza della parete laterale).

 

La corretta riproduzione dei transitori richiede una risposta in frequenza piatta e una risposta a fase minima o lineare. La riproduzione corretta dei transitori, che caratterizzano la musica ed il parlato, sono essenziali per l’intelligibilità (Definizione Orizzontale della Chiarezza) e la localizzazione della sorgente (assieme all’ITG della registrazione e dell’ambiente). La voce umana si estende a partire da 80 Hz ma nel parlato la prima fondamentale è almeno una (uomo) o due (donna) ottave più alta (160-320 Hz circa) mentre la più alta si ferma a 3kHz circa.

Ai fini della intelligibilità del parlato è sufficiente un sistema con risposta (ragionevolmente) piatta da 300-500 fino a 2000-3500 Hz.. I commentatori delle riviste Stereophile e HiFi Choice ritengono che un diffusore acustico debba essere massimamente piatto tra 300-500 e 5000 Hz (e sostanzialmente ci siamo).

 

Il transitorio di attacco di un suono è il trigger (grilletto) che fa scattare l’analisi di un nuovo evento sonoro da parte dell’apparato uditivo. La riproduzione dei fronti di discesa dei transienti è altrettanto importante perché questi possono mascherare i transitori di attacco dei suoni successivi. La riverberazione ambientale allunga i tempi di decadimento (fronti di discesa) e, se la riverberazione è eccessiva, le “code sonore” diventano mascheranti. Anche in questo caso il suono perde di Chiarezza (articolazione, definizione o come la si vuol chiamare) indipendentemente dalla qualità del diffusore acustico. Anche un ottimo diffusore, in un ambiente troppo riverberante, perde Chiarezza ma non per sua colpa. Ne segue che, dovendo scegliere, è meglio disporre di un buon sistema di riproduzione in un ottimo ambiente piuttosto che il contrario.

Le vibrazioni ed i modi normali dei cabinet producono lo stesso deleterio effetto: l’ allungamento dei tempi di decadimento dei transitori con effetto mascherante. Qui però la qualità del diffusore, ed in particolare del cabinet, è essenziale.

I modi normali dell'ambiente generano cose molto fastidiose in particolare negli ambienti "piccoli" dove i modi normali sono m ben distanziati e distinguibili (basso monocorde).

 

Ne segue che la corretta “messa in fase” degli altoparlanti è inutile se, per esempio, il mobile del diffusore acustico non è opportunamente realizzato come pure se le riflessioni laterali (dell’ambiente) sono eccessive o se il tempo di riverberazione è eccessivo, se sono presenti modi normali troppo forti o anche se il punto di ascolto è troppo lontano dei diffusori.

Strumentalmente, nella risposta impulsiva nel campo semivicino di un tweeter, sono visibili anche le riflessioni prodotte dalle teste delle viti di fissaggio. Tali riflessioni producono effetti visibili nella risposta in frequenza a partire da 3-4000 Hz (secondo le dimensioni). Grazie alle ricerche di Haas, Toole e altri sappiamo che le prime riflessioni provocano un allargamento delle dimensioni della sorgente con ripercussioni sulla localizzazione. In letteratura si legge che ritardi nell’ordine di 700 micro secondi producono spostamenti della sorgente virtuale. Altri sostengono che si possano discriminare ritardi di 6-7 microsecondi (corrispondenti a meno di un centimetro). E’ certo che la diffrazione ai bordi “aiuta” a riconoscere le dimensioni della sorgente (e distrugge la condizione di fase minima).

Anche esperimenti condotti con toni sinusoidali (quindi non direttamente riferibili all’ascolto della musica) dimostrano che l’orecchio è sensibile alla fase tra 200 e 2000 Hz ( o tra 500 e 1000 Hz secondo gli autori). In questo range di frequenze l’apparato uditivo utilizza la differenza di fase per la localizzazione della sorgente quindi c’è un risconto a livello fisiologico che rende questa informazione credibile.

 

 

 

Conclusioni

 

Allo stato attuale possiamo dire che:

 

-          l’apparato uditivo dimostra una sensibilità alla fase almeno tra 500 e 1000 o 2000 Hz

-          questo è coerente con i processi di localizzazione della sorgente

-          l’apparato uditivo utilizza i transienti di attacco per determinare l’inizio delle consonanti e in generale per attivare i processi di localizzazione (di qualsiasi sorgente)

-          la riverberazione e le code sonore, di qualsiasi natura, mascherano i transitori, riducono la  Chiarezza (definizione orizzontale) e rendono la risposta in fase meno importante. Questo non vuol dire che la riproduzione non possa risultare gradevole. Riducendo la riverberazione si evidenzieranno i difetti.

 

la Chiarezza ha tre prerequisiti: Calore, Fatica da Ascolto e Forza devono essere almeno decentii. Se un diffusore acustico è carente in uno questi tre attributi la Chiarezza viene compromessa. La Chiarezza, a sua volta, è il prerequisito della Spazialità: una carenza di Chiarezza (del diffusore in sé o a causa di eccesso di riverberazione dell’ambiente) limita la percezione della Spazialità.

 

La conclusione è che un diffusore acustico deve possedere una ottima risposta ai transitori, ovvero, deve discostarsi il meno possibile dalla condizione di fase minima (o lineare) almeno in gamma media.

 

L’affermazione di Ohm va aggiornata come segue: in un ambiente molto riverberante le rotazioni di fase non sono udibili. Probabilmente ai tempi di Ohm le camere anecoiche nemmeso esistevano…

 

Sempre per quanto riguarda la localizzazione della sorgente (indispensabile per la ricostruzione della Spazialità) resta da dire ancora una cosa: quando la sorgente è visibile la localizzazione avviene attraverso la vista (e non con l’apparato uditivo). Una corretta riproduzione dei transitori è ancora necessaria per la Chiarezza anche se, sempre attraverso la vista, l’intelligibilità del parlato viene aiutata dalla lettura labiale (anche inconscia).

 

Leo Beranek, nel suo famoso libro "Acoustics", ad un certo punto afferma che è meglio scegliere l'incrocio tra woofer e medio sotto i 500 Hz "per motivi psicoacustici". Questa "regola pratica" era nota già quasi 70 anni fa agli albori dell' Alta Fedeltà quando non era inusuale realizzare sistemi con woofer caricati a tromba piegata che introducevano notevoli ritardi tra l'emissione del woofer e del medio.

Scegliere la frequenza del woofer comporta due conseguenze:

 

-          se la frequenza è "alta" il sistema sopporterà più potenza

-          se la frequenza è bassa la gamma media suonerà meglio

 

il limite tra queste due regioni è a circa 500 Hz e ancora oggi molti sistemi a tre vie hanno i woofer tagliati "alti". Se il diametro del woofer non è eccessivo la cosa non comporta gravi danni.

 

Nei sistemi moderni, da quando è disponibile il DRC, appare più opportuno portare il primo taglio in prossimità della frequenza di Schroeder dell'ambiente (200 Hz circa per ambienti da 100 metri cubi con T60 da 1 secondo). In questo modo il DRC, per correggere l'ambiente, agisce sostanzialmente sul woofer.

(si ricorda che il DRC deve essere utilizzato sostanzialmente in attenuazione).

 

I sistemi con più di tre vie, per esempio con un sub-woofer tagliato sotto i 100HZ e un medio-basso tagliato sopra i 200 Hz, non offrono particolari vantaggi (rispetto per esempio all'uso di due woofer per canale.