L’udito e Psicoacustica

di Mario Bon

Bozza del 10 dicembre 2012

Riletto il 15 febbraio 2013 – da rivedere ancora

 

Paragrafi di questo capitolo:

Introduzione

La risposta in frequenza dell'orecchio

Localizzazione della sorgente

Dimensione della sorgente

Suono reale, Suono atteso, Suono (della) finestra

Battimenti del secondo ordine

Effetto Haas

Effetto McGurk

Effetto Franssen

Effetto Ventriloquo

Fusione Binaurale

Effetto Cocktail Party (Ascolto intenzionale o Ascolto Critico)

Mascheramento

Backward recognition masking (o informational masking)

Effetto Mozart

Gli effetti non lineari

Fatica da ascolto:

Distorsione aurale (vedere suono dell’amplificatore)

Ricostruzione della fondamentale mancante (rintracciamento della fondamentale o virtual pitch)

Il Terzo suono di Tartini

Effetto Zwicker o Zwicker Tone

Scala di Shepard

PAT: PsicoAcustica Transizionale

Effetto Specchio

Conclusioni 

Bibliografia

 

Introduzione

La psicoacustica è una scienza relativamente giovane e in via di sviluppo. Un importante passo in avanti   è stato fatto (negli anni ’60) con la definizione degli attributi del suono e più recentemente con il Modello Neurofisiologico. La definizione degli attributi del suono sposta l’attenzione dal dispositivo al suono prodotto dal dispositivo. Grazie alla definizione degli attributi del suono  è possibile progettare un auditorio con caratteristiche acustiche predefinite. Negli ultimi anni gli studi si sono concentrati anche sugli effetti dovuti al padiglione auricolare (pinna). E’ stato anche evidenziato che il processo di localizzazione coinvolge  la memoria, il riconoscimento di modelli (pattern matching), la vista, ecc. La psicoacustica, oggi, è un supporto fondamentale nella progettazione degli amplificatori e dei diffusori acustici. E’ praticamente certo che l’apparato uditivo svolga operazioni analoghe alla convoluzione di spettri se non anche una valutazione della coerenza.

 

L’udito ha due funzioni fondamentali: il controllo dell’ambiente e la comunicazione (riconoscimento della voce). Queste funzioni si sono affinate con l’evoluzione. Gli apparecchi per la riproduzione sonora sono sviluppatii “solo” negli ultimi cento anni:  questi dispositivi riproducono suoni e situazioni nuove e “innaturali” che possono indurre vere e proprie illusioni acustiche. Per questo motivo molti esperimenti, condotti con toni sinusoidali puri, forniscono risultati incerti in quanto non direttamente riferibili alle condizioni reali.    

Va tenuto conto, infatti, che l’apparato uditivo si sforza di dare sempre una interpretazione alle sensazioni sonore. Tale interpretazione, essendo basata sulla memoria pregressa, può essere giusta, sbagliata ma anche “inventata”. Come esistono le illusioni ottiche, così esistono le illusioni acustiche.

 

La psicoacustica studia i vari aspetti della percezione del suono.

 

Per la psicoacustica un fenomeno è accettabile quando viene percepito almeno dal 71% di una popolazione composta da individui con l’udito perfetto.  Il soggetto medio quindi non risulta dalla media statistica su una popolazione indistinta (uomini, donne, giovani, vecchi, bambini) che fornirebbe un soggetto medio “mezzo sordo” ma da soggetti non patologici dall'udito perfetto.

 

Estendendo questo concetto il “fruitore medio di Alta Fedeltà” deve essere un “ascoltatore medio” istruito all’ascolto della musica dal vivo e alla musica riprodotta.

 

La psicoacustica distingue :

 

effetti del Primo Ordine

corrispondono ai movimenti della membrana basilare (hanno quindi una causa meccanica nel movimento della membrana basilare provocata, a sua volta, dal movimento del timpano).

 

effetti del Secondo Ordine

quelli che si generano all’interno del cervello senza apparenti cause fisiche e che non corrispondono a movimenti della membrana basilare (vedere per es. Battimenti).

 

 

L’apparato uditivo analizza il suono in intervalli che vanno da 35-50 fino a circa 100 millisecondi (Tempo o intervallo di integrazione). L’ intervallo di integrazione viene adattato al tipo di segnale: più breve per il parlato e più lungo per la musica. Questo giustifica la definizione dell’indice di chiarezza (o Chiarezza). La musica viene “trattata” dall’emisfero celebrale destro, il parlato da quello sinistro.

 

Una operazione che l’apparato uditivo esegue con grande efficacia è la soppressione degli echi che ricadono all’interno dell’intervallo di integrazioni. In pratica il cervello riesce ad associare a ciascun suono la sua riflessione e, se cade all’interno dell’intervallo di integrazione, la utilizza per rinforzare lo stimolo sonoro. In questo modo udiamo una eco distinta solo quando il ritardo tra il suono diretto ed il suono riflesso supera i 100 milli secondi. Se non fosse così sarebbe impossibile comprendere una conversazione in un ambiente chiuso. Recenti studi confermano che, per ottenere questo risultato, l’apparato uditivo esegue delle operazioni  simili alla correlazione. In realtà dovremmo dire: se dovessimo implementare un sistema di riconoscimento delle eco come quello dell’apparato uditivo, dovremmo utilizzare le tecniche di correlazione.

La soppressione degli echi ha un effetto collaterale: l’aumento delle dimensioni apparenti della sorgente.

 

 

Scala dei tempi in secondi

Luogo di elaborazione

sensazione

Infuelnza (cultura, ambiente, stato)

primi 1 o 2  milli

 

localizzazione

 

60 micro – 60 milli

Orecchio interno

Altezza, intensità, timbro

Debole

Circa 0.1

Collegamento nervoso tra orecchio e corteccia

Transitori, timbro, direzionalità, identificazione, discriminazione

 

< 0.1

Corteccia cerebrale

Ritmo, messaggio musicale

 

 

Emisfero sinistro

Breve termine (sequenzializzazione, parlato)

 

 

Emisfero destro

Lungo termine (integrazione spaziale (visiva) e temporale (uditiva)

Forte

Luoghi e tempi della elaborazione del messaggio sonoro

 

La risposta in frequenza dell'orecchio

 

Ogni individuo ha un apparato uditivo con caratteristiche peculiari a cominciare dalla “risposta in frequenza”, sensibilità, tempo di integrazione, ecc. ecc. . Ne segue che difficilmente due individui  “sentono” alla stesso modo e non c’è da stupirsi se qualcuno preferisce un tipo di suono (analogico) piuttosto di un altro (digitale).   

 

Figura (a) sorgente di fronte al oggetto


Figura (b) sorgente a 90° (di fronte all'orecchio)

 

La figura qui sopra riporta la “risposta normalizzata” misurata all'ingresso del canale auricolare per dieci individui diversi ed è tratta da: "Recording Studio Design" di Philip Newell, pagina 28
Seconda Edizione 2008 Published by Elsevier Ltd. ISBN: 978-0-240-52086-5
 
Le risposte sono tutte marcatamente diverse con variazioni di parecchi dB proprio nella zona di maggior sensibilità. La causa di queste differenza è la diversa conformazione anatomica del padiglione auricolare (pinna), testa e anche spalle.


Per completezza riportiamo anche le curve di Loudness

Curve di Loudness

 

Queste curve rappresentano la sensibilità dell’orecchio al variare del livello dello stimolo.

Lo stimolo, in questo caso, sono toni puri (sinusoidali) con frequenza compresa tra 20 e 20000 Hz.

 

Il riferimento è posto a 1000 Hz.

Si leggono in questo modo. Preso come riferimento un tono puro a 1000 Hz con livello di 60 dB affinché un tono a 20 Hz sia percepito allo stesso livello deve essere amplificato di 42 dB circa (oltre 100 volte)

 

Per questo motivo, ascoltando a basso volume le frequenza basse sembrano più deboli.

 

Queste sono curve “medie” e variano da individuo a individuo

 

 

Localizzazione della sorgente

 

Uno degli aspetti psicoacustici che riguarda la riproduzione musicale in ambiente domestico è  la localizzazione della sorgente: in assenza della visione della sorgente i processi di localizzazione determinano la ricostruzione spaziale dell’evento riprodotto. In presenza della visione della sorgente la localizzazione avviene attraverso la vista.     

 

Agli inizio del 1900 Lord Rayleigh  spiegò la localizzazione con la teoria duale. Secondo Rayleigh la localizzazione dipende da due meccanismi:

 

Differenza Temporale Interaurale

 

prevalente alle medie frequenze. L’apparato uditivo ricava le informazioni dalla differenza temporale tra i suoni che pervengono alle due orecchie.

Differenza di Intensità Interaurale

prevalente alle alte frequenze. L’apparato uditivo ricava le informazioni dalla diversa attenuazione con cui il suono giunge alle due orecchie.

 

  

Il nostro sistema uditivo risolve con sicurezza suoni che giungono alle orecchie con un ritardo di gruppo di circa mezzo millesimo di secondo (in questo tempo il suono percorre circa 17 cm. pari alla distanza media tra le orecchie). Per frequenze inferiori a 500 Hz (lunghezza d’onda = 68 cm.) non riusciamo a determinare la provenienza del suono con certezza (la distanza tra le orecchie è insufficiente per determinare una differenza di fase).

 

Più precisamente dovremmo dire che la localizzazione è difficile o impossibile per i suoni con uno scarso contenuto energetico sopra i 500 Hz.  Ciò non escude che sia possibile localizzare una sorgente che emetta, per esempio, un suono a 50 Hz con un forte contenuto di armoniche oltre la 10^ . Infatti la localizzazione avviene nel primo millisecondo del transitorio di attacco e i suono transitori posseggono tutti uno spettro esteso verso le alte frequenze.

 

La nostra difficoltà nel localizzare le frequenze basse viene sfruttata nelle registrazioni dove le prime ottave sono quasi sempre registrate in monofonia (suddividendo l’energia  del segnale equamente sui canali destro e sinistro).

 

Oggi alcuni ricercatori affermano che il sistema uditivo sia in grado di risolvere eventi sonori separati da intervalli di 5 micro-secondi (1.72 millimetri ). La cosa non deve stupire: se siamo in grado di risolvere con sicurezza 500 micro  secondi (17 centimetri) è probabile che, in certe particolari condizioni, questa capacità possa essere molto maggiore.

 

La localizzazione è migliore quando la sorgente si trova di fronte all’ascoltatore ed all’altezza delle sue orecchie (di qui la scelta della posizione del midrange e del tweeter in un diffusore acustico).  

 

Se un suono, che contiene riverberazione naturale, giunge contemporaneamente alle due orecchie con la stessa ampiezza,

la sorgente viene individuata di fronte all’ascoltatore. Ciò determina la ricostruzione del canale centrale virtuale nell’ascolto stereofonico.

 

Se il livello del suono che raggiunge le due orecchie  è  diverso, ma rimane la contemporaneità

la sorgente virtuale appare spostata rispetto al centro.  La contemporaneità della percezione del suono produce, nell’ascolto stereofonico, la distribuzione delle sorgenti virtuali, in senso orizzontale, tra i due diffusori. 

Se un suono, che NON contiene riverberazione naturale, giunge contemporaneamente alle due orecchie con la stessa ampiezza

la sorgente viene individuata all’interno della testa ( IHL = Inside the Head Localization = Localizzazione all’interno della testa).  Questo avviene con l’ascolto in cuffia o in ambiente anecoico (privo di riflessioni).

 

L’ascolto in cuffia e l’assenza di riverberazione non è una situazione “naturale” così come non è normale sentire un suono dentro al cranio.

In linea di principio l’apparato uditivo riesce a risolvere due sorgenti concorrenti se sono separate da almeno 6° sul piano orizzontale e circa 8° sul piano verticale.

 

Per determinare la distanza di una sorgente l’apparato uditivo utilizza la memoria.. Quando udiamo un suono per la prima volta non possiamo determinare la distanza della sorgente. Invece in un ambiente noto, conoscendo l’intensità della sorgente, ne valutiamo la distanza in base all’attenuazione. In ambiente chiuso l’apparato uditivo utilizza sia la memoria che la riverberazione. Di questa vengono valutate le riflessioni che seguono il suono diretto entro le prime decine di millisecondi e la loro attenuazione rispetto al suono diretto. Chi non ha mai frequentato i concerti dal vivo manca di riferimenti mnemonici

 

In sostanza l’apparato uditivo è in grado di valutare la distanza critica (o raggio di riverberazione). La dispersione degli altoparlanti per le note alte si riduce al crescere della frequenza, riducendo la potenza acustica immessa nell’ambiente. Con la potenza acustica decresce anche il livello del campo riflesso e la distanza critica aumenta. Questo tende ad avvicinare alcuni strumenti (come i piatti della batteria) che, spesso, appaiono “troppo in primo piano”  come se suonassero davanti ai tweeter.

 

Durante la riproduzione stereofonica la profondità viene ricostruita attraverso la riverberazione contenuta nella registrazione (per questo il tempo di riverberazione dell’ambiente d’ascolto dovrebbe essere inferiore al tempo di riverberazione contenuto nella registrazione: per non fare confusione). Trattandosi di segnali deboli, la ricostruzione della profondità richiede sistemi di riproduzioni caratterizzati da elevata Chiarezza. Una elevata Chiarezza è associata all’ ottima risposta ai transitori. In particolare il sistema di riproduzione non deve prolungare il decadimento ed il rilascio dei transienti in modo da non mascherare l’attacco dei transienti successivi.

 

Nella ricostruzione dell’altezza della sorgente giocano diversi fattori:

 

Psicoacustico

Istintivamente tendiamo a posizionare le frequenze basse in basso e quelle alte in alto. In effetti tutti gli animali di piccole dimensioni emettono suoni acuti e vivono sugli alberi oppure volano. I leoni e gli elefanti, invece, stanno per terra. Questo istinto si è rivelato utile per la sopravvivenza dei nostri antenati.

Anatomico

Particolare conformazione del padiglione auricolare.

Risposta in frequenza dei diffusori

Il senso dell’altezza della sorgente può essere incrementato orientando l’asse di emissione dei diffusori verso l’alto e/o con un boost nella regione attorno a 8000 Hz ma questo ultimo espediente comporta anche altri effetti negativi sul Calore (vds attributi del suono)

Geometria dei diffusori

Le registrazioni stereofoniche non contengono alcuna informazione sull’altezza delle sorgenti e questa dimensione viene ricostruita, in modo sostanzialmente arbitrario, dai diffusori acustici.

 

Sistema 7+1

Il sistema 7+1 prevede un diffusore dedicato alla ricostruzione dell’altezza della sorgente (posto al centro sopra al canale centrale).

 

Dimensione della sorgente

 

La dimensione della sorgente viene riconosciuta anche attraverso il fenomeno della diffrazione ai bordi. Questo è particolarmente rilevante in relazione alla larghezza dei pannelli frontali dei diffusori acustici. I bordi del diffusore acustico agiscono come sorgenti secondarie. Se il suono diffratto dai bordi arriva arriva all’ascoltatore con un certo ritardo si avrà la percezione di una sorgente “più larga”. Questo argomento viene trattato più in dettaglio con riferimento ai diffusori acustici. Si veda anche il paragrafo successivo ( Suono della finestra)

 

Suono reale, Suono atteso, Suono (della) finestra

 

Il “suono reale” è il suono prodotto dalla sorgente originale nell’ambiente originale. Per esempio il suono di un pianoforte suonato in una sala da concerto e ascoltato dai posti centrali dalla quinta fila della platea.

 

Il “Suono atteso” è il suono che l’ascoltatore immagina (o desidera) per una certa sorgente. Per esempio un appassionato vorrebbe che il pianoforte suonasse secco e preciso (anche se la registrazione è stata fatta con un solo microfono a 10 metri di distanza in una chiesa). Il suono atteso consegue all’abitudine di ascoltare (un certo tipo di) musica riprodotta sempre con lo stesso impianto stereo senza confronti con le sorgenti reali (rara o nulla frequentazione dei concerti dal vivo). Chi ascolta lo stesso impianto per lungo tempo difficilmente poi trova alternative soddisfacenti (assuefazione). Non è detto che si tratti sempre di un effetto negativo: come minimo fa risparmiare soldi.

 

Siamo perfettamente in grado di capire quando un suono proviene da una finestra aperta (“Suono della finestra”) e siamo altrettanto in grado di sentire la differenza che c’è nell’ascoltare (per es. il rumore della città) stando affacciati alla finestra o dall’interno della stanza. Ciò dipende dalle riflessioni e diffrazioni sugli stipiti della finestra che definiscono la dimensione della sorgente.

 

Suono Reale: riconoscimento della voce e degli strumenti

riconosciamo una voce conosciuta dal vivo, dalla televisione, dalla radio, dal telefono, dal citofono di casa, nel rumore della folla.

Evidentemente questa voce è memorizzata con pattern diversi (in più versioni diverse). Il riconoscimento avviene su base spettrale (la membrana basilare è un analizzatore di spettro a finestra variabile).

Allo stesso modo riconosciamo il timbro degli strumenti musicali. Quando il suono che udiamo coincide con l’archetipo che teniamo in memoria la “fedeltà” è massima. In sostanza non esiste una “Alta Fedeltà”  in  assoluto ma tanti modelli di “fedeltà” personalizzati. Fortunatamente la maggior parte di questi modelli sono abbastanza simili. 

 

Battimenti del secondo ordine

Il fenomeno dei battimenti del secondo ordine consiste nella sensazione di modulazione di ampiezza che si avverte quando lo stimolo è composto da due suoni puri che eccitano la membrana basilare in regioni che non si sovrappongono. La frequenza f2 sia posta inizialmente ad un valore f2 = 2 f1. Si può notare che per diverse differenze di fase iniziale fra le due componenti la forma d’onda cambia notevolmente. Se la differenza di fase si mantiene perfettamente costante, tuttavia, l’ascoltatore non percepirà alcuna differenza. Quando la frequenza f2 viene leggermente stonata rispetto all’ottava ( f2 = 2 f1 +e), la differenza di fase non rimane più costante. Il sistema uditivo percepisce in queste condizioni battimenti a frequenza fb = e (Figura 2.18). Battimenti del secondo ordine si ottengono anche stonando leggermente intervalli di quarta e di quinta  con frequenze di battimento rispettivamente di fb = 3e e fb = 2e Hz. Questo fenomeno mette bene in risalto come il senso dell’udito sia insensibile a differenze di fase costanti nel tempo, ma non significa che sia sensibile alla variazione della fase nel nel tempo. Non dinostra nemmeno che l’apparato uditivo sia sensibile all’inviluppo.

 

Il battimento è la sensazione di fluttuazione del suono prodotta quando si odono due suoni di frequenza vicina ma in relazione non armonica. Indica l’incapacità dell’orecchio di risolvere due suoni di frequenza troppo vicina.

La distorsione aurale dell’orecchio provoca la sensazione di percepire la frequenza differenza (frequenza dell’inviluppo). In pratica il sistema uditivo non è sensibile all’inviluppo ma provoca distorsione per intermodulazione. Vedi anche terzo suono del Tartini

Questo è un effetto del secondo ordine.

 

 

 

Effetto Haas

 

Haas (1951) studiò la capacità dell’apparato uditivo di determinare la direzione di provenienza di un suono. Haas stabilì che il cervello identifica come sorgente quella fisicamente più vicina (il suono che arriva per primo, il suono diretto) anche in presenza di sorgenti più intense ma più lontane (che arrivano in ritardo).  Per questo motivo l’effetto Haas è detto “effetto precedenza” o “legge del primo fronte”. Haas ha anche provato, indirettamente, che un suono riflesso che giunga entro un intervallo di circa 35 millisecondi non viene percepito come distinto ma viene utilizzato da sistema uditivo per “rinforzare” il suono diretto migliorandone la intelligibilità.

Per completezza vanno citati anche gli studi di Olive e Toole che hanno studiato le condizioni di udibilità delle riflessioni in funzione del ritardo e della attenuazione con cui giungono all’orecchio. La udibilità delle riflessioni non dipende dall’angolo di incidenza con una eccezione: quando la riflessione arriva dalla stessa direzione del suono diretto. In tal caso la riflessione risulta mascherata dal suono diretto di 5-10 dB. I programmi musicali contengono sempre una certa dose di riverberazione (naturale o artificiale) e questa proviene dalla stessa direzione del suono diretto. A causa del mascheramento, nell’ascolto in cuffia, percepiamo una quantità di riverberazione minore rispetto a quella che percepiamo con i diffusori acustici e per questo motivo l’ascolto in cuffia appare più dettagliato.  Ricapitolando:

 

·         il suono diretto determina la posizione della sorgente (primo millisecondo)

·         le riflessioni che giungono entro i primi millisecondi definiscono la dimensione della sorgente: l’orecchio non percepisce due sorgenti distinte (la sorgente reale e la sorgente riflessa) ma una unica sorgente più estesa.

·         le riflessioni che giungono entro i successivi 35-50 milli secondi vengono utilizzate, con la memoria, per valutare  la posizione e per migliorare l’intelligibilità, 

·         quelle ancora successive (da 50 a 80 mS, campo diffuso) sono utilizzate per valutare la dimensione dell’ambiente.

·         oltre 80 milli secondi di ritardo si iniziano a percepire echi separati (la sorgente reale e la sorgente riflessa separate, sempre che suono diretto e riflessione siamo coerenti)

·         oltre i 100 mS di ritardo si percepisce un eco distinto (sempre che suono diretto e riflessione siamo coerenti).

 

 

 

 

 

S = Sorgente, A = Ascoltatore.

 

I limiti temporali di questi intervalli sono soggettivi e, in letteratura, cambiano da un autore all’altro.

Sintetizzando ulteriormente finché l’apparato uditivo riesce a mantenere una correlazione tra il suono diretto ed il  corrispondente suono riflesso, utilizza le informazioni per ricostruire posizione, dimensione e distanza della sorgente. Quando le riflessioni arrivano da tutte le direzioni (e si è stabilita nell’ambiente la condizione di campo diffuso) o si è persa la correlazione tra suono diretto e suono riflesso, le informazioni non sono più riferibili alla sorgente ma sono ancora utili per definire la dimensione dell’ambiente.

 

Esperienze maturate nell’ambito della musica elettronica indicano che un ritardo di 700 micro secondi è sufficiente per provocare uno spostamento o un allargamento della sorgente virtuale. In 700 micro secondi il suono percorre circa 24 centimetri. Se il pannello frontale di un diffusore acustico è largo meno di 24 cm. il suono diffratto dai bordi del pannello stesso non accumulerà ritardo sufficiente per produrre allargamento della sorgente che apparirà puntiforme. I diffusori acustici con il pannello frontale stretto risultano così adatti all’ascolto ravvicinato (punto di ascolto tra 1 e 2 metri) producendo un livello SPL più elevato, e con la possibilità di stabilire un rapporto ottimale tra suono diretto e suono riflesso anche in ambienti mediamente riverberanti (T60 = 0.6-0.8 secondi).

In condizioni particolari sembra che l’apparato uditivo riesca a distinguere ritardi di 5 micro secondi… in condizioni particolari… sembra….

 

 

 

Effetto McGurk:

descritto nel 1976 da  Hanry McGurk e detto anche effetto McGurk-MacDonald. E’ una particolare interazione tra vista e udito (percezione della voce): quando in un filmato un attore pronuncia la sillaba “DA” ma il doppiaggio pronuncia “BA” (o qualche altra cosa che somiglia) se si osserva contemporaneamente il labiale si viene indotti a percepire un suono che non è “DA” e non è “BA” ma qualche cosa di intermedio. questo effetto è il tipico esempio di come l’apparato uditivo venga indotto in errore quando è alle prese con situazioni diverse da quelle “naturali”. In natura non esiste il cinema doppiato e il nostro udito si è sviluppato ben prima che nascesse. Ne segue che questo effetto non fa altro che testimoniare che ci troviamo di fronte ad una situazione sconosciuta per la quale l’apparato uditivo non ha una chiave interpretativa. Si tenga presente che la lettura labiale è uno dei meccanismi che normalmente utiliziamo per migliorare la comprensione (intelligibilità) del parlato. Lo studio di Wareham & Wright del 2005 ha dimostrato che l’incoerente informazione visiva può cambiare la percezione di espressioni vocali, suggerendo che l'effetto McGurk può avere molte influenze nella percezione quotidiana.

 

Effetto Franssen:

 

L’effetto Franssen è una illusione acustica che provoca la non corretta localizzazione di una sorgente in un ambiente chiuso  riverberante.  E’ un effetto del secondo ordine. Franssen ha descritto due effetti:

 

Effetto Franssen 1

 

Ci sono due diffusori a destra e a sinistra dell’ascoltatore. Ogni diffusore è a circa un metro dall’ascoltatore a circa 45°.

Il diffusore sinistro inizia a riprodurre un tono puro. Il volume viene diminuito (in modo esponenziale) a sinistra e aumentato a destra. ad un certo punto il diffusore destro è la principale sorgente di suono. L’ascoltatore percepisce il suono ancora proveniente da sinistra.

 

Effetto Franssen 2

In un ambiente chiuso ci sono due altoparlanti in posizioni diverse. L’esperimento inizia con l’altoparlante 1 che emette un segnale sinusoidale che inizia passando immediatamente da 0 alla massima ampiezza. Questo altoparlante viene facilmente localizzato. Il segnale viene spostato lentamente dall’altoparlante 1 al 2 . Anche quando è solo l’altoparlante 2 a emettere l’ascoltatore continua a localizzare la sorgente nell’altoparlante 1 .

 

Si osservano tre cose:

 

 

Nell’esperimento di Franssen si verifica un unico transitorio al momento dell’attivazione dell’altoparlante sinistro e quella è l’unica occasione che l’apparato uditivo ha per localizzare la sorgente.

In sostanza l’effetto Franssen dimostra, o conferma, tre cose:

 

·         la localizzazione della sorgente avviene nell’ intervallo di tempo che trascorre tra l’arrivo del primo impulso di suono diretto e l’arrivo della prima riflessione

·         una nuova localizzazione viene riconosciuta solo in corrispondenza di un nuovo transitorio.

·         l’apparato uditivo riconoscere il suono diretto e le sue riflessioni che giungono entro il tempo di integrazione. Se noi dovessimo fare la stessa cosa in laboratorio, dovremmo applicare un processo di correlazione.

 

L’effetto Franssen attribuisce la massima importanza alla natura impulsiva dei suoni. Sia il parlato che la musica sono fenomeni di tipo transitorio.

 

Effetto Ventriloquo

 

La visione della sorgente induce il cervello a localizzare la sorgente nella posizione definita dalla vista. Come nel caso del ventriloquo, siamo indotti a riconoscere come sorgente la bocca del pupazzo (che si muove) e non la bocca del ventriloquo che è ferma. Il cervello scarta l’impossibile e prende il probabile per poi disinteressarsi al problema. Questo effetto è ampiamente sfruttato nel cinema dove i dialoghi sono riprodotti dal canale centrale (posto al centro dello schermo) ma la sensazione dello spettatore è che la voce provenga dagli attori (indipendentemente dalla loro posizione sullo schermo). Questo effetto, quando attivo, sovrasta gli altri meccanismi di localizzazione.

 

Quando occhio e orecchio agiscono contemporaneamente la localizzazione della sorgente sonora dipende dal senso che riceve lo stimolo maggiore. Nell’ascolto HiFi domestico la vista non è coinvolta. Al contrario al cinema prevale lo stimolo visivo.  Il modo migliore per valutare la Spazialità di un impianto stereo è ascoltarlo al buio. Al contrario per mascherare le carenze di focalizzazione basta riprodurre un concerto in DVD.

 

Fusione Binaurale

 

E’ la capacità del cervello di “fondere” due messaggi sonori diversi (giunti alle due orecchie) in un unico segnale. Per esempio se alle due orecchie vengono inviate due sequenze armoniche diverse il cervello ce ne farà sentire una terza sintesi delle due ma diversa da entrambe (è un effetto del secondo ordine). Questo meccanismo crea la percezione della armonia nella musica: ad un concerto siamo in grado di concentrarci su un singolo strumento (ascolto critico o intenzionale) ma solo se abbandoniamo questa particolare prospettiva possiamo percepire l’armonia della fusione degli strumenti in un tutto. L’uso della cuffia per ascoltare musica non è naturale. Con le cuffie si possono produrre “illusioni acustiche” interessanti: per esempio inviando alle due orecchie due toni sinusoidali di frequenza diversa ma vicina,il cervello percepisce anche la frequenza differenza. Ciò significa che, in questo caso, la non linearità non è un difetto dell’orecchio ma dei processi celebrali. Non dimentichiamo comunque che questo esperimento è innaturale per due motivi: le cuffie e i  suoni sinusoidali.

 

Effetto Cocktail Party (Ascolto intenzionale o Ascolto Critico)

Ascolto Intenzionale è la capacità dell’ascoltatore di isolare gli elementi di un suono complesso o di una sequenza di suoni. E’ detto anche ascolto critico.  L’effetto cocktail party è un aspetto dell’ascolto intenzionale.

 

L‘apparato uditivo ci offre la possibilità di concentrarci, localizzare o isolare una sorgente anche in presenza di disturbi. Con questo meccanismo il rapporto segnale/rumore può essere migliorato fino a 15 dB. Questo effetto è detto Effetto Cocktail Party per rappresentare la capacità di un ascoltatore di concentrarsi su una conversazione anche in presenza di molte persone che parlano contemporaneamente. Più in generale possiamo parlare di ascolto intenzionale o ascolto critico quando concentriamo la nostra attenzione su una singola componente di un evento musicale.

E’ importante notare che, se si registra un insieme di conversazioni e le si riproducono attraverso un sistema stereofonico a due canali, l’ascoltatore avrà più difficoltà a concentrarsi su una singola conversazione. La cosa diventa impossibile con la riproduzione monofonica. Infatti la  registrazione stereofonica conserva una parte della Spazialità originale mentre la monofonia le informazioni spaziali sono completamente confuse. A fronte di ciò è forte la pretesa degli audiofili di riuscire a collocare con precisione la posizione dei diversi strumenti durante la riproduzione. La cosa è possibile ma difficilmente si può paragonare con l’ascolto dal vivo (dove agisce anche la vista).

Ne segue che un modo per valutare la bontà di una registrazione è la possibilità di esercitare l’ascolto critico sui singoli strumenti.  La fusione binaurale è l’opposto dell’ascolto intenzionale: solo abbandonando l’intenzionalità si può percepire l’evento musicale per come è stato concepito. Del resto solo un ottimo sistema di riproduzione, eliminando la fatica da ascolto, consente di immergersi nella musica.

 

 

Mascheramento

 

Il mascheramento è uno dei fenomeni psicoacustici più importanti e studiati: si manifesta quando si odono più suoni contemporaneamente. Supponiamo di ascoltare un tono puro a 440 Hz (il LA centrale). Accendiamo un secondo generatore che emette un secondo tono puro ma a 460 Hz . Il volume del secondo tono parte da  0 e sale lentamente. Ad un certo punto il tono a 460 Hz diventa udibile ma questo avviene ad un livello più alto rispetto a quanto sarebbe stato necessario in assenza del tono a 440 Hz. Questo significa che la presenza del tono a 440 Hz impedisce di sentire (maschera) il tono a 460 Hz e per sentirlo se ne deve aumentare il livello oltre la normale soglia di percezione. Se questo aumento è di 10 dB allora si dice che il tono da 440 Hz ha mascherato il tono a 460 Hz di 10 dB. Se ripetiamo questa operazione su un intervallo di frequenze centrate attorno a 440 Hz riportando il livello necessario alla frequenza mascherata per diventare udibile, otteniamo un grafico a campana con il massimo leggermente spostato alla destra di 440 Hz (il che indica che le frequenze acute sono più facilmente mascherate). La larghezza della campana così tracciata viene detta “banda critica”. La larghezza delle bande critiche non è costante (sono più larghe a bassa frequenza) ma vengono  approssimate ad un terzo di ottava (da qui la scelta di eseguire le analisi a terzi di ottava). Questo è il mascheramento per toni puri. Quando i segnali mascheranti e mascherati sono delle bande di rumore o dei segnali musicali, le cose si complicano considerevolmente.

Il fenomeno del mascheramento influisce solo parzialmente sulla riproduzione musicale: se un suono è mascherato durante l’esecuzione dal vivo sarà mascherato anche durante il playback. Come accennato il mascheramento attenua quella parte di riverberazione che proviene lungo la stessa direzione del suono diretto.

Tuttavia al di sotto dei 100 Hz, la distorsione di seconda armonica cade all’interno della banda critica e potrebbe essere mascherata dalla fondamentale. Probabilmente questo è uno dei motivi per cui la distorsione di seconda armonica a bassa frequenza è meno fastidiosa (con toni puri). Questo non può essere un alibi per giustificare la presenza di distorsione armonica pari a bassa frequenza nei dispositivi HiFi (in particolare nelle elettroniche). La presenza di distorsione armonica implica la produzione di distorsione per intermodulazione che è ben più udibile e deleteria della distorsione armonica stessa. Fanno eccezione i diffusori a tre vie con taglio tra woofer e medio sotto i 200 Hz perché i segnali a bassa frequenza non possono intermodulare con i segnali riprodotti dal medio. In questo caso la distorsione prodotta dal woofer risulta effettivamente meglio tollerata.

 

Nella musica sono presenti componenti spettrali più intense (che hanno effetto mascherante) e altre meno intense che risultano mascherate. Sulla base di questa osservazione i brani musicali vengono “sfoltiti” per ridurre le dimensioni fisiche dei file (compressione MP3).  

 

Più in generale si può parlare di mascheramento ogni volta che un suono interferisce sulla comprensione di un altro suono. In questo senso anche l’eccessivo riverbero o la distorsione provocano mascheramento.

Un esempio tipico sono le sorgenti indesiderate che si interpongono tra l’ascoltatore e la sorgente e le riflessioni che provengono da tergo (che interferiscono con la Chiarezza).

 

Backward recognition masking (o informational masking)

La riduzione della capacità di riconoscere un suono dovuta alla successiva percezione di un suono con contenuto informativo simile. Questo tipo di mascheramento sembra risultare da un processo diverso dal consueto mascheramento. In italiano si chiama “confusione”. Un esempio potrebbe essere l’eco che, ripetendo una sillaba, induce confusione. Un altro esempio potrebbe essere una riflessione laterale.

 

 

Effetto Mozart:  è una controversa teoria secondo la quale l’ascolto della musica di Mozart produrrebbe effetti benefici fino all’aumento dell’intelligenza. Lo stato della Georgia (gennaio 1998) arrivò a stanziare 105.000 $ annuali per consentire alle madri in attesa di acquistare CD di Mozart. Le ricerche per confermare queste teorie non hanno dato conferme definitive. Altri sostenitori sono Don Campbell (1997  - "The Mozart Effect: Tapping the Power of Music to Heal the Body, Strengthen the Mind, and Unlock the Creative Spirit" e The Mozart Effect For Children) e A. Tomatis. In sostanza l’effetto Mozart è stato ampiamente sopravalutato negli effetti e gonfiato anche dai giornali a causa di equivoci di varia natura. Sembra comunque che l’ascolto della Piano Sonata in D major (K.448), abbia un effetto sui pazienti epilettici e continua ad esserci un certo interesse perché, se fosse vero, rappresenterebbe un metodo di cura senza farmaci.  Esiste un altro brano musicale che induce un effetto Mozart: la canzone “Acroyali/Standing in Motion" (versione da Yanni Live at the Acropolis eseguito all’Acropolis) del compositore greco Yanni che presenta molte analogie con la K448. Quello che sembra certo è che l’ascolto della K448 non aumenta l’intelligenza ma “improved spatial-temporal learning in rats”.

 

Cosa molto diversa è l’effetto che può avere lo studio della musica e l’esecuzione della musica di Mozart: imparare a suonare uno strumento come il clavicembalo o il pianoforte produce miglioramenti del controllo motorio, aumento dell’autostima, miglioramento della memoria, ecc. ecc. questi effetti però derivano dallo sforzo, dall’esercizio e dalla disciplina necessari per imparare a leggere la musica e suonare uno strumento.

 

Ma perché proprio la musica di Mozart risulta essere la più adatta? L’ipotesi formulata da Gordon Shaw, uno degli “scopritori” dell’effetto, è che oltre alle incredibili doti logiche, mnemistiche, e musicali di cui era dotato Mozart, il musicista componeva in giovane età, sfruttando al massimo le capacità di fissazione spazio-temporale di una corteccia cerebrale in fase evolutiva, cioè al culmine delle sue potenzialità percettive e creative. Tomatis (che va preso con le molle) sostiene pertanto che l’ascolto della musica mozartiana è in grado di favorire l’organizzazione dei circuiti neuronali, rafforzando i processi cognitivi e creativi dell’emisfero destro.

 

Una possibile conferma dell’ “effetto Mozart”, studiato a partire dal 1993, arriva da una ricerca effettuata dal Mind Institute di Costa Meza in California e pubblicato dalla rivista Neurological Research. Lo studio è stato eseguito utilizzando due serie di topolini sottoposti all'ascolto sistematico di musica classica. Un primo gruppo di bestioline è stato costretto ad ascoltare la Sonata di Mozart K448 per 12 ore al giorno per 10 settimane. Un secondo gruppo di topolini, sottoposti al brano ''Per Elisa'' di Beethoven per lo stesso periodo di tempo e con la stessa intensità. La scelta di questo brano di confronto non è casuale. Precedenti studi di imaging funzionale avrebbero dimostrato che "Per Elisa" non attiverebbe le stesse aree celebrali. Dopo 6 ore di silenzio, ad entrambi i gruppi di topolini sono state testate le capacità di ''ragionamento spazio-temporale'', in pratica le funzioni cognitive di apprendimento e memoria, con il classico test del labirinto. I ricercatori hanno così verificato che i topolini "appassionati" di Mozart, oltre a compiere un minor numero di errori, si sono rivelati anche più veloci nell'eseguire i test. La superiorità di questi topolini è rimasta intatta anche riducendo l'esposizione di musica del 58% e facendo trascorrere 24 ore di silenzio prima del test, a significare che l'effetto Mozart sul cervello dei topi non è transitorio, ma durevole nel tempo.

 

Non tutti gli studiosi sono concordi nel valutare la rilevanza scientifica di questi risultati. Non si esclude comunque che in un prossimo futuro la musica di Mozart possa assumere davvero un effettivo ruolo terapeutico, ad esempio nell'aiutare a rallentare i sintomi di epilessia, alzheimer o altri disturbi neurodegenerativi.

 

Gli effetti non lineari

 

L’apparato uditivo non è un sistema lineare: non lo è l’orecchio (inteso come “microfono”) e non lo sono i processi celebrali che elaborano il suono. Ne segue che non vale il principio di sovrapposizione degli effetti così come lo enunciamo nell’ ambito della teoria dei sistemi.

Per esempio se inviamo alle due orecchie, tramite una cuffia, due toni sinusoidali di frequenza vicina (F1 all’orecchio destro e  F2 all’orecchio sinistro) il cervello percepisce anche un tono di frequenza pari alla differenza F1-F2. Questo terzo suono si genera nel cervello ed è un fenomeno del secondo ordine. Attenzione però perché questa situazione è innaturale sia per l’uso delle cuffie che per uso di toni sinusoidali puri come stimoli. Si tratta comunque di un caso particolare di Fusione Binaurale.

 

Fatica da ascolto:

La Fatica da Ascolto è la sensazione di affaticamento, fino alla cefalea, che deriva dallo sforzo prolungato necessario per comprendere un messaggio sonoro non univoco. Le cause possono essere diverse:

 

-          eccessivo riverbero dell’ambiente (riduce l’intelligibilità del parlato)

-          rumore (maschera il segnale utile)

-          distorsione non lineare (nei sistemi di riproduzione, maschera il segnale utile)

-          programmi musicali eccessivamente  sovramodulati

-          risposta in frequenza eccessivamente sbilanciata (nei sistemi di riproduzione)

-          un suono dal timbro sgradevole (gesso sulla lavagna, lametta sul vetro)

-          altre cause di tipo psicologico.

 

La Fatica da ascolto è anche un attributo del suono del diffusore acustico. Si veda il capitolo dedicato agli attributi del suono.

 

Distorsione aurale (vedere suono dell’amplificatore)

L’apparato uditivo non è lineare e produce distorsione di intermodulazione (vds terzo suono). Necessariamente produce anche distorsione armonica detta distorsione aurale. La distorsione aurale nasce nelle coclea ed è nota dal 1924 (effetto del primo ordine). Studi successivi hanno confermato il fenomeno che è stato misurato sfruttando i battimenti.

 

La compressione tollerabile in un segnale musicale è dello stesso ordine di grandezza della compressione operata dallo stapedio. A fronte di un segnale intenso la compressione avviene “esternamente” all’orecchio se lo stapedio non deve intervenire (o interviene meno) la sensibilità rimane più alta

 

 

Frequenza delle armoniche autogenerate in funzione del livello del suono percepito

Livello del armoniche autogenerate in funzione del livello del suono percepito

 

 

 

Nel 1967 Olson ha misurato le prime 8 armoniche su una vasta gamma di livelli SPL (vds figura).

 

Si noti che l'orecchio crea livelli significativi della seconda armonica, quasi il 10% della fondamentale, per i livelli di pressione sonora (SPL) di 90 dBA e oltre.

 

Il grafico riporta l’energia di ciascuna armonica quindi l’1% si trova a –20 dB anziché a –40 come di norma.

 

Olsen, Harry F. “Music, Physics and Engineering”

Dover Publications, Inc. N.Y., 2nd ed. : 1967.

 

 

Questi dati provengono dalla tesi di leurea A NEW METHODOLOGY FOR AUDIO FREQUENCY POWER AMPLIFIER TESTING BASED ON PSYCHOACOUSTIC DATA THAT BETTER CORRELATES WITH SOUND QUALITY di Daniel H. Cheever (2001)

 

La seconda armonica di un tono a 1kHz sta 50dB sopra alla soglia di udibilità…..

Inspecting this data, the second harmonic of a 1kHz fundamental tone is 50dB above the threshold of hearing. In 1967 Olson[28] from RCA/Victor R&D Labs continued testing the first 8 harmonics and over a broad range of sound pressure levels, reproduced here in Fig. 2-2. This has been redrawn for clarity in Fig 2-3. Notice that the ear creates significant levels of the second harmonic, nearly 10% of the fundamental for sound pressure levels (SPL’s) of 90dBA and above.

 

Il livello delle armoniche oltre il terzo ordine rimane sotto allo 0.1% fino a pressioni di 120 dBA (prossime alla soglia del dolore) C’è da chiedersi come sia stato possibile misurare una nona armonica a oltre –100 dB a 80dBA.

 

Un aumento della distorsione con il livello d’ascolto (per esempio di un amplificatore) viene interpretata dal cervello come distorsione dell’orecchio stesso, che la giudica causata da un aumento di livello superiore al reale. In questo caso l’ascoltatore potrà attribuire alla catena di riproduzione una “capacità dinamica” superiore… “(Giussani)

 

Ricostruzione della fondamentale mancante (rintracciamento della fondamentale o virtual pitch): quando il nostro orecchio percepisce un suono composto da una successione di armoniche tipo 100, 150 200, 250, 300, 350… Hz tende “automaticamente” ad aggiungere la fondamentale mancante (in questo esempio 50 Hz). In sostanza si ha la sensazione di sentire la fondamentale (la nota più bassa) anche se fisicamente questa non è presente. I mini diffusori si avvantaggiano di questo effetto dando l’illusione di una maggiore estensione verso le basse frequenze. Si noto che il tono a 50 Hz corrisponde alla differenza di due armoniche successive quindi è una conseguenza della distorsione di intermodulazione dell’orecchio.

 

Il Terzo suono di Tartini

Giuseppe Tartini (nato a Pirano, 12 aprile 1692 – morto a Padova, 26 febbraio 1770) violinista e compositore italiano, autore della sonata per violino in sol minore “Il Trillo del Diavolo”. Scopritore del Terzo Suono cui ha dedicato un saggio. Se si suonano contemporaneamente un LA (440 Hz) e un MI (660 Hz) si percepisce anche il LA più basso (220 Hz) cioè l'ottava sotto del LA 440 (660 - 440 = 220).
Questo sistema è utilizzato anche nella costruzione degli organi per creare un DO basso che richiederebbe una canna molto lunga. A volte, al posto di una unica canna molto lunga se ne trovano due più corte (corrispondenti al DO 8va ed al SOL 12ma): il loro suono contemporaneo dà la sensazione di sentire  il DO basso. La causa di questo fenomeno sta nella non linearità intrinseca dall’orecchio (che soffre di un certo tasso di distorsione per intermodulazione). Questo però non giustifica la presenza di distorsione anche degli apparati di riproduzione.  Caso mai il contrario.

Effetto Zwicker o Zwicker Tone: Il tono Zwicker è una sconcertante illusione uditiva. E 'stato scoperto nel 1964 da Eberhard Zwicker Bell Labs, e consiste in questo: un rumore a banda larga con un gap spettrale è presentato per pochi secondi. Il rumore viene quindi spento bruscamente. Sebbene non ci sia il silenzio totale, la maggior parte ascoltatori sente un segnale debole puro per alcuni secondi. La frequenza del tono udito corrisponde al gap presente nel rumore (dove invece c’era il “silenzio”). Sono stati trovati  diversi tipi di rumore che portano tutti ad un tono Zwicker ma la sua origine è sempre rimasta poco chiara. I Biofisici oggi hanno un modello neuronale che può spiegare l'effetto Zwicker. La soppressione di rumore di fondo è l'ingrediente chiave nel generare l'effetto. Il tono Zwicker(in quanto sensazione uditiva transitoria) è spesso pensato come un tinnito a breve termine. Capire l’effetto Zwicker fornisce una visione nuova di come acufene potrebbe essere il risultato di una persistente attivazione di un meccanismo di riduzione del rumore all'interno del cervello umano.

 

Scala di Shepard: illusione acustica,  Roger N. Shepard, Journal of the Acoustical Society of America 36 2346 (1964), doi:10.1121/1.1919362 . Si tratta di particolari scale musicali che vengono ripetute ed a ogni ripetizione sembrano salire in frequenza (anche se la frequenza rimane la stessa). Effetti "di tipo Shepard" si trovano anche utilizzati in musica sotto forma di progressioni modulanti (per esempio nella Fantasia e Fuga in Sol minore per organo BWV 542 di J.S. Bach) o mediante altri espedienti.

·         Nella parte finale del brano Echoes dei Pink Floyd un glissando di coro maschile è stato tagliato ad anello, e mixato in modo da dare l'illusione di una salita continua, esso emerge dalla dissolvenza di una lunga ripetizione guidata dalla chitarra elettrica;

·        all'opposto del nostro esempio qui sotto. L'album A day at the races dei Queen si apre e si chiude circolarmente con piccolo trio strumentale in cui si sente una scala di Shepard eseguita per mezzo di chitarre elettriche.

 

 

 

PAT: PsicoAcustica Transizionale

 

La psicoacustica transizionale, secondo i suoi scopritori, è una disciplina e una tecnica scientificamente testata che, facendo ascoltare uno specifico suono stazionario (rumore rosa a = 1/f), microsincronizzato (*) attraverso il sistema audio AVS® (Brevetto Internazionale), stimola, nel soggetto, un incremento dei sincronismi tra popolazioni neuronali nella corteccia cerebrale.

Tali sincronismi sono direttamente correlabili ad un aumento delle capacità fisiche e creative del soggetto migliorando per 24-48 ore l’equilibrio psicofisico generale. Con riferimento al soli effetti psichici, aumentando le possibilità di “comunicazione” tra aree del cervello, il soggetto diviene più consapevole delle proprie modalità di significare il mondo. In una dimensione di incrementata plasticità cognitiva ed emotiva si può sviluppare un colloquio più efficace con il counselor/terapeuta, indipendentemente dalla cornice teorica di riferimento utilizzata.

 

(*) rumore rosa microsincronozzato: i 4 canali vengono ritardati indipendentemente uno dall’altro in modo da giungere all’ascoltatore tutti con lo stesso ritardo a passi di 30 microsecondi (1 centimetro circa). Evidentemente la testa dell’ascoltatore deve essere immobilizzata.

 

Vedere http://www.avsresearch.org/index.html

 

Emisfereo celebrale sinistro

Emisfereo celebrale destro

In verde viene rappresentata la quantità di aree neuronali in fase tra loro in assenza di stimoli, occhi chiusi. In nero viene rappresentata la quantità di aree neuronali in fase tra loro con stimolo AVS.

 

Immagini simili a quelle qui sopra (che nostrano un aumento dell’attività celebrale) sono utilizzate anche per dimostrare la sensibilità dell’essere umano agli ultrasuoni. L’orecchio non è in grado si percepire gli ultrasuoni tuttavia la loro presenza stimola l’attività celebrale si tratta quindi di un effetto del secondo ordine.

Gli ultrasuoni potrebbero stimolare i neuroni per risonanza. Che poi esistano dei meccanismi di percezione delle frequenze ultrasoniche non dovrebbe stupire: anche le frequenze infrasoniche (non udibili) vengono percepite e producono effetti rilevanti (per esempio nausea e produzione di ormoni nelle capsule surrenali e nell'ipofisi).

 

Effetto Specchio: (http://www.avsresearch.org/index.html) (brevetto USA)

è una illusione acustica causata da una distorsione del flusso uditivo indotta da una particolare disposizione delle sorgenti. Nell’ambito del sistema AVS 3D VS alla consueta coppia di diffusori stereo viene associata una seconda coppia di diffusori che viene posta specularmene agli altoparlanti frontali rispetto al punto di ascolto. Quando i 4 diffusori suonano contemporaneamente l’apparato uditivo riceve contemporaneamente 5 canali centrali e non riesce a stabilire una direzione di provenienza del suono (due si focalizzano “nella testa” uno frontale e uno posteriore). Questa sensazione, se il suono utilizzato non è sinusoidale, è innaturale e non ha corrispondenza nella memoria dei fenomeni acustici reali. Tuttavia il cervello, entro pochi minuti (max mezz’ora), trova una soluzione e posiziona la sorgente “attorno” al punto di ascolto dando origine ad un particolare effetto olografico. Quando l’esperienza si ripete la situazione viene riconosciuta e l’effetto viene stabilito in un tempo minore (anche un solo secondo). Va rimarcato che tale effetto non contraddice le conoscenze acquisite (effetto Haas,  effetto Fressen): è un effetto nuovo indotto artificialmente.

 

http://www.andreavonsalis.eu/

http://www.avsresearch.org/

http://www.marcostefanelli.com/subliminale/hrm.htm

 

Non si tratta evidentemente di olografia (che è una cosa diversa) e probabilmente la sensazione ha poco a che vedere con l’ascolto della musica dal vivo.  

Il soggetto deve stare seduto su uno sgabello senza schienale o in piedi precisamente al centro dei 4 diffusori che devono essere uguali. Potrebbe essere necessario equalizzare la risposta della coppia posteriore. Inevitabilmente questo sistema di ascolto è adatto per una persona alla volta quindi ci si deve fidare di una testimonianza non direttamente controllabile.  

In linea di massima non sembra necessario alcun processore ma solo un metro per sistemare con precisione i 4 diffusori simmetricamente attorno al punto di ascolto.

 

LF = Left Front

RF = Right Front

 

LR = Left Rear

RR = Right Rear

 

Con questa configurazione di formano 5 canali centrali.

LF+RF ; LR+RR ; LF+RR ; RF+LR ; (LF+LR)+(RF+RR)

 

(THE “MIRROR EFFECT” IN SOUND’S FUSION TIME: THE INTEGRATION OF TWO SPECULAR SOUND FIELDS IN ONE MENTAL-VIRTUAL HOLOPHONIC SOUND FIELD. PHENOMENOLOGY AND APPLICATIONS. Di  Gubert Finsterle)

 

 

 

Effetto specchio con due coppie di diffusori commerciali collegati in serie.

In alternativa si possono usare due amplificatori pilotati dalla stessa sorgente. I quattro diffusori devono essere uguali e adatti all’ascolto ravvicinato. Per limitare l’effetto dell’ambiente devono essere anche abbastanza direttivi.

 

 

 

 

Conclusioni 

Questa breve trattazione non esaurisce tutti gli aspetti o gli effetti psicoacustici della percezione sonora ma almeno rende l’idea di quanto sia complicato riprodurre o simulare il comportamento dell’apparato uditivo.

La determinazione della distribuzione spaziale delle sorgenti (sia come posizione che come dimensioni) coinvolge una serie di meccanismi che dipendono dall’udito, dalla vista, dalla memoria, ecc. Per un sistema di riproduzione collocare gli strumenti nello spazio con le giuste dimensioni  è il compito più difficile perché richiede caratteristiche ottimali per tutti i dispositivi presenti nella catena. Tuttavia se la registrazione dell’evento sonoro non contiene informazioni sulla localizzazione (per esempio se la ripresa è stata eseguita con i microfono molto vicini agli strumenti) non c’è diffusore al mondo in grado di ricostruirla.

 

 

Bibliografia

 

Beranek, L. L.

Acoustics. McGraw-Hill Book Company ISBN 07-004835-5 e ISBN 0-88318-494-X

1954

Spagnolo

Manuale di Acustica Applicata, UTET 

2001

F. Alton Everest

Manuale di acustica. Milano: Hoepli

2002

Beranek, L. L.

Concert and Opera Houses – Spinger – seconda edizione ISBN 0-387-95524-0

2004

Cingolati - Spagnolo

Acustica Musicale e Architettonica, UTET 

2005

 

 

 

Sean E. Olive and Floyd E. Toole

National Research Council, Ottawa

The Detection of Reflections in Typical Rooms

 

Floyd E. Toole

Vice President Harman International Industries, Inc

Loudspeakers and Rooms for Multichannel Audio Reproduction (perte 1,2,3 e 4)

Floyd E. Toole,

Vice President Harman International Industries, Inc

The Science of Audio