Emissione NPS©

Testo originale di Renato Giussani, integrato e semplificato da Mario Bon (nel rispetto delle idee originali)

 

Il concetto di “Distribuzione dello Spettro” delle frequenze Audio si applica nell’NPS (Natural Perspective System) secondo due modalità distinte che potremo per semplicità chiamare Distribuzione Orizzontale e Distribuzione Verticale.

 

 

PREMESSA


Scena acustica – Soundstage :
Tutto lo “spazio acustico” generato dai diffusori si trova principalmente davanti all’ascoltatore.

Durante la riproduzione musicale domestica l’ascoltatore percepisce:

 

Sorgenti reali

I diffusori acustici

Sorgenti virtuali

Immagini riflesse delle sorgenti reali

Illusorie

fantasma

esistono solo nella testa di chi ascolta, come ad esempio l’immagine centrale che si ottiene in un sistema stereofonico alimentato con un segnale monofonico,

inesistenti

ricreate da complessi fenomeni psicoacustici).

 

Durante l’ascolto dal vivo le sorgenti “prevalenti” sono quelle reali. Durante l’ascolto di musica riprodotta le sorgenti “prevalenti” sono quelle virtuali. 

La scena acustica percepita varia al variare del tipo di sistemi di trasduzione, della loro forma e dimensioni, delle loro caratteristiche di emissione, della loro risposta in frequenza ed all’impulso, dell’ambiente, dell’ascoltatore, della sua posizione, della sua esperienza d’ascolto di suono reale e/o riprodotto, della sua situazione fisica/psicologica al momento del particolare ascolto.


Normalmente si conviene che la scena acustica possa essere caratterizzata da una ampiezza (più o meno “stabile”), una altezza (spesso molto aleatoria) ed una profondità (profondità), entro la quale i vari “piani sonori” possono essere più o meno facilmente distinguibili.


NPS ORIZZONTALE
In qualsiasi sistema stereofonico la massima ampiezza della scena acustica ricostruita è coincidente con la distanza che separa i diffusori (in assenza di riflessioni laterali).
Lo spettatore percepisce un segnale costituito dalla sovrapposizione del campo e del campo riflesso.

Nei normali ambienti domestici la distanza critica è piccola alle basse frequenze ed aumenta con la frequenza.

 

La  distribuzione orizzontale si  ottiene con una  ampia gamma  di diffusori  sistemati come  segue:

i  diffusori  devono essere molto distanti, il punto  di  ascolto  ed i diffusori devono formare un angolo ottuso e i diffusori devono incrociare davanti alla testa dell'ascoltatore.

In questo modo  non solo di  allarga la  zona isotipica ma  si possono distinguere  un maggior  numero  di  sorgenti virtuali distinte  tra  i  due diffusori. Se poi andiamo a vedere i diagrammi polari ci accorgiamo che non sono troppo diversi da qielli delle ESB 07.

 

IL PROBLEMA
Se l’ascoltatore è equidistante dai due diffusori e questi emettono segnali uguali, la sorgente fantasma di cui percepirà la presenza sarà unica e posizionata al centro fra i due diffusori reali.

 

Questa è una illusione dovuta la fatto che questa situazione è innaturale e l’orecchio ne resta ingannato.

 

Quando però l’ascoltatore non può porsi esattamente sull’asse di simmetria dei sistema, ogni spostamento comporterà un aumento dei livello del segnale diretto percepito dal diffusore cui si sarà avvicinato e una diminuzione dell’altro. La cosa importante da osservare è che a causa dell’esistenza dei campo riverberato, per spostamento entro un’area di ascolto ragionevole, le variazioni di livello riguardano le frequenze superiori a 1000/1200 Hz (secondo me 500 Hz); le variazioni di livello che eventualmente intervengano a frequenze inferiori, possono essere di entrambi i segni a seconda dell’andamento dei campo di prime riflessioni e di onde stazionarie che si sarà instaurato in quel particolare ambiente e come tali non sono da tenere in conto ai fini della localizzazione.

 

Distorsione prospettica

Distorsione timbrica

 

 

Distorsione prospettica (a sx)

Distorsione timbrica (a dx)

Dunque l’effetto di un ascolto da posizione asimmetrica sarà sempre affetto da due tipi di distorsioni: 

 

Distorsione prospettica, conseguente alla localizzazione delle sorgenti fantasma slittata verso il diffusore più vicino. Ciò avviene per tutte le sorgenti tranne che per quelle “virtuali” generate da segnali “solo sinistro” o “solo destro”, per cui l’ampiezza apparente della scena acustica non varia, ma si deforma comprimendosi da un lato e rarefacendosi dall’altro;
Slittamento delle sorgenti acustiche virtuali con lo spostamento della posizione di ascolto (dopo Bauer).

 

Distorsione timbrica, conseguente alla diminuzione dei livello di alte frequenze percepito dal diffusore più lontano e all’aumento di quelle ricevute dal più vicino. 

In un’esperienza classica Stevens e Newman dimostrarono che per localizzare le sorgenti acustiche nello spazio il nostro sistema uditivo utilizza sia le informazioni temporali che quelle di intensità. Ovvero in presenza di due sorgenti acustiche concorrenti uguali, la posizione della sorgente virtuale sarà più vicina a quella delle due il cui segnale arriva o prima o più forte alle orecchie dell’ascoltatore (vds anche effetto Haas).
Ma l’esperimento definì anche che a frequenze inferiori ai 1.500 Hz per la localizzazione vengono preferite le informazioni sul tempo di arrivo, mentre al di sopra dei 3/4.000 Hz vengono utilizzate le differenze di intensità.

 

Esiste una ampia zona di sovrapposizione (almeno una ottava, per altri almeno due) per la quale la localizzazione avviene in un “terzo modo” da qui l’ipotesi che la localizzazione non avvenga con 2 meccanismi distinti su bande adiacenti ma con un unico meccanismo (quello attivo nella regione di sovrapposizione) che a bassa e ad alta frequenza si semplifica mostrando aspetti diversi.

Dato che l’apparato uditivo deve già eseguire una correlazione (tra le ue orecchie) non si vede perché dovrebbe eseguire ulteriori processi.

 

La soluzione


Ricordando quanto detto sui campi diretto e riverberato degli ambienti domestici e considerando che il campo acustico alle basse frequenze è affetto da irregolarità rilevanti causate da riflessioni e onde stazionarie, mentre il campo riverberato non può fornire informazioni direzionali, appare evidente come un sistema stereofonico studiato per offrire una localizzazione corretta sulla base di variazioni di intensità alle frequenze medie alte sia particolarmente promettente.

 

In sostanza, se l’apparato uditivo utilizza le differenze di intensità per localizzare le sorgenti si deve agire su questo parametro (che è giò sfruttato nelle registrazioni stereo con il pan-pot)

 

Le novità dell’approccio NPS (orizzontale) al problema delle deformazioni timbriche e prospettiche per posizioni di ascolto non equidistanti dai due diffusori consistono quindi nelle seguenti due proposizioni:

 

1) in normali ambienti domestici la localizzazione delle sorgenti fantasma in una scena acustica dipende soprattutto dalle differenze di intensità fra i due canali alle frequenze superiori ai 1.000/2.000 Hz (io direi 500 Hz);

 

2) il sistema deve compensare le distorsioni prospettiche con un intervento in funzione della frequenza tale da ottenere anche l’invarianza timbrica su tutta l’area di ascolto prevista.

 

Questo è il sistema di dispersione delle ESB 07 che però introduce una quantità di diffrazione ai bordi.

 

 

Sistema NPS

 

I diffusori NPS-1000 Insignis rispondono esattamente alle richieste di orientazione (30°) per una distanza di ascolto pari a 1,5 volte quella che separa i diffusori.

Il risultato finale sono perciò dei diffusori che, rispetto alle proposte convenzionali, oltre ad avere l’asse di massimo livello di emissione opportunamente orientato, sono caratterizzati da una dispersione opportunamente ridotta e decrescente con continuità all’aumentare della frequenza secondo un andamento prestabilito.
Dalla scelta di distribuire in senso orizzontale lo spettro audio in funzione dell’angolo di emissione discendono i seguenti vantaggi:

 

1

possibilità di risolvere correttamente la struttura orizzontale della scena acustica nelle varie sorgenti virtuali e fantasma elementari da qualsiasi posizione di ascolto;

2

percezione dell’informazione timbrica relativa a ciascuna sorgente corretta da qualsiasi posizione di ascolto

.

Quindi la distanza del punto di ascolto è maggiore della distanza tra i diffusori. Nella configurazione che propongo io, invece, la distanza del punto di ascolto è minore della distanza tra i diffusori. La rsposta in potenza può poi essere integrata con delle sorgenti ausiliarie come il CLD


L’NPS VERTICALE

 

Nella registrazione stereo non ci sono informazioni sull’altezza delle sorgenti. La ricostruzione dell’altezza dipende dai diffusori acustici. Nei sistemi 7+1 un diffusore viene posto sopra allo schermo per fissare l’altezza di determinate sorgenti (e questo diffusore è una sorgente reale)


Nell’NPS, la espansione verticale della scena acustica e l’autodimensionamento delle sorgenti virtuali congruente con le caratteristiche dello spettro di frequenze emesso dalle sorgenti reali, sono ottenuti facendo riprodurre le varie porzioni nelle quali viene suddiviso lo spettro audio dalle diverse vie del sistema di altoparlanti, da zone emittenti aventi una dimensione verticale che approssimi al meglio la lunghezza d’onda della frequenza di centro-banda della porzione di spettro che riproduce.

 

In sostanza se due altoparlanti sono tagliati a 1000 Hz la loro distanza deve essere di 34 centimetri (ne segue che i filtri non possono essere troppo pendente altrimenti verrebbe a mancare la zona di sovrapposizione che deve essere di almeno una o due ottave). In tal caso  la dispersione verticale presenta  due zeri a 30° sopra  e  30° sopra  gli  altoparlanti,   Se  tutte  le  vie sono configurate alle  stesso modo gli zeri della  dispersione verticale  saranno sempre   a  più o meno 30° e si ottiene un sistema con diagrammi polari meno variabili in funzione della frequenza. Questo però comporta l’l’uno di un numero adeguato di vie.


I centri delle varie zone di emissione delle porzioni dello spettro acustico riprodotto (costituite, fisicamente da altrettante vie ed altrettanti altoparlanti singoli e/o gruppi di altoparlanti) sono qui poste ad una distanza verticale fra loro molto piccola, in una sequenza che veda comunque aumentare la frequenza degli spettri riprodotti con l’aumentare della quota dal pavimento).

 

I diffusori NPS-1000 Insignis hanno un’altezza rilevante rispetto alle altre due dimensioni e gli altoparlanti sono dislocati a distanze notevoli l’uno dall’altro.
Le considerazioni che sono alla base di questa scelta tengono conto della risoluzione delle sorgenti da parte dei nostro sistema uditivo in funzione dell’angolo di ricezione verticale e della frequenza (Rodgers).

 

Le sorgenti acustiche naturali sono tridimensionali nello spazio tridimensionale. Il nostro sistema uditivo è in grado di distinguere la direzione i provenienza dei segnali (in orizzontale e verticale) e proprio grazie alla diversa dislocazione nello spazio può meglio selezionare il segnale al quale vuole “prestare attenzione”, separandolo dagli altri contemporaneamente presenti (Effetto Cocktail party).

 

I segnali monodimensionali possono essere distinti nel tempo, nella frequenza e nella coerenza.

In uno spazio tridimensionale la separazione dei segnali può avvenire per:

 

-          tempo

-          frequenza (spettro, intensità)

-          coerenza

-          direzione  (due angoli)

-          distanza   (modulo)

 

questo significa che possiamo distinguere due sorgenti, poste in posizioni diverse, ma solo se differiscono anche per spettro, intensità, o tempo. Altrimenti, come nell’effetto stereofonico, percepiamo una sorgente virtuale. In natura la probabilità che il suono giunga da più sorgenti uguali situate in posti diversi è praticamente nulla. Quando qualche cosa del genere avviene (per esempio con l’eco) il sistema di localizzazione va in confusione.

 

 Con una sorgente acustica artificiale (sistema di altoparlanti) che emetta tutti i segnali acustici da un unico punto quest’operazione sul vettore intensità acustica non è più possibile.

 

Diciamo le cose per bene:

La Opera Callas 2007 è un esempio di come sia possibile modificare l’orientamente dell’asse di radiazione con la frequenza. In quel modello la cosa era limitata sopra 1500 Hz ma può essere realizzata, con lo stesso sistema, anche a partire da un paio di ottave più in basso. Agli estremi della banda, il cervello già associa i suoni bassi come provenienti dal basso ed i suoni alti come provenienti dall’alto. In iù l’altezza apparente di una sorgente può essere alterata agendo sul suo spettro. Quindi la cosa è limitata alla gamma media (in particolare alla zona di sovrapposizione).

La valutazione della distanza della sorgente e la percezione delle dimensioni dell’ambiente sono invece determinate dalle memorie pregresse.


Distribuendo le zone di emissione sulla dimensione verticale dei diffusore (non disturbando così l’effetto stereo orizzontale) in modo che a segnali differenti corrispondano zone di emissione diverse, si restituisce al sistema uditivo la possibilità di selezionare e analizzare il particolare desiderato sia utilizzando differenze di spettro, sia di angolo di ricezione.
Non v’è dubbio che questa situazione di ascolto sia più realistica di quella in cui le tre dimensioni del mondo reale sono ridotte al centro di una “sfera pulsante”.

 

Ragionamento molto bello e che apparentemente non ha punti deboli. Non si tiene conto della distanza dalla sorgente. Quando si ascolta una chitarra a un metro o a 6 metri di distanza non è la stessa cosa. Ne segue, per logica, che il sistema NPS non può funzionare al meglio sia con piccoli gruppi che con la grande orchestra.

La filosofia di Giussani configge, dal punto di vista psicoacustico, con la fusione binaurale mentre sarebbe utile nell’ascolto intenzionale.

La separazione lungo la verticale delle sorgenti si attiene anche con un sistema multivia con altoparlanti “grandi” rispetto alla lunghezza d’onda e separati con cross-over ad elevata pendenza.

 

Una distanza fra i trasduttori superiore a quella prescelta porterebbe viceversa alla difficoltà da parte del sistema uditivo di considerare ciascun diffusore come una sorgente acustica coerente; come dire che le varie porzioni di spettro apparirebbero come emesse da elementi completamente distinti, senza la possibilità di ricostruire la sensazione di segnale unico proveniente da una sorgente estesa univocamente posizionata nello spazio. Tale condizione deve essere necessariamente rispettata autonomamente per l’emissione dello spettro di ciascuna sorgente acustica fantasma, indipendentemente dalla dimensione verticale massima e dalla quota che le verranno soggettivamente attribuite.
Dalla scelta di distribuire in senso verticale lo spettro audio in funzione dell’angolo di ricezione, discendono i seguenti vantaggi:

 

1) possibilità di risolvere più facilmente i programmi complessi nei vari segnali elementari;
2) conferimento alla scena acustica di una realistica dimensione verticale;
3) autodimensionamento delle zone di emissione congruente con caratteristiche delle sorgenti acustiche reali.

 

Dalla scelta di distribuire lo spettro audio sia in senso orizzontale che verticale, deriva infine il vantaggio di conferire alla scena acustica una tridimensionalità ed una stabilità che rendono meno avvertibile la presenza dei diffusori, stimolando una naturale partecipazione all’evento musicale.

 

La stabilità dell’immagine (qualunque essa sia) dipende dal grado di uguaglianza tra i due diffusori.

La presenza dei diffusori dipende dalla diffrazioni ai bordi sul piano orizzontale ovvero dalla larghezza del pannello frontale in funzione della distanza di ascolto (ovvero fattori geometrici)

 


L’NPS E IL CONTROLLO DELLA SENSAZIONE DI PROFONDITA’ DELLA SCENA ACUSTICA

Profondità NPS

 

Profondità NPS

 

Le sorgenti fantasma che vengono sottoposte alla correzione prospettica del sistema NPS sono solo quelle il cui spettro contiene frequenze medie ed alte interessate alla variazione della dispersione tipica dell’NPS.

 

E qui c’è da discutere perché lo spettro degli strumenti musicali è molto ampio.

 

La correzione poi sarà più o meno consistente a seconda di quanto è importante questa porzione dello spettro delle sorgenti considerate rispetto al loro spettro complessivo. Durante una registrazione dal vivo, le sorgenti reali e virtuali più lontane avranno uno spettro sicuramente più povero in frequenze medie e alte rispetto alle sorgenti più vicine, che con l’NPS vedranno quindi la loro posizione corretta e ricentrata maggiormente. Disegnando una tipica situazione d’ascolto come quella descritta e ponendo dietro alla parete frontale due sorgenti fantasma centrali uguali (due violini?), l’una più vicina (magari proprio a 3 metri davanti a voi) e l’altra più lontana (ad esempio a 10 m), dal centro le sentirete più o meno sovrapposte di fronte a voi, ma sarà difficile valutarne la distanza, dato che le uniche differenze fra i due segnali saranno costituite solo da diversi livelli e diverso spettro (che potrebbero anche essere emessi da due violini diversi suonati in modo diverso, ma magari l’uno accanto all’altro).

 

La distanza viene valutata sulla base dlle esperienze pregresse al massimi la riverberazione può dare una indicazione relativa. Ma non si possono fare ragionamenti di tipo geometrico.

 

 

Ora, spostandovi di lato, la sorgente più vicina, grazie al suo spettro ricco di frequenze alte e alla correzione prospettica tipica dell’NPS, rimarrà fissa al centro fra le due casse, mentre quella lontana si sposterà lungo il segmento che congiunge le due casse, dalla stessa parte verso la quale vi sarete spostati voi. Se sul disegno citato congiungete la vostra posizione con quella delle due sorgenti, vedrete che la retta che vi “unisce” alla sorgente lontana interseca appunto il segmento congiungente le due casse, rispetto al centro, dalla parte dalla quale vi sarete spostati. Questo equivale ad informare il vostro sistema uditivo che quella sorgente fantasma, caratterizzata da uno spettro più “chiuso”, un livello più basso e che si è spostata seguendovi nel vostro movimento, evidentemente è “più lontana”. Ora, dato che quanto descritto si verifica per lo spettro di tutti i segnali di una grande orchestra, ecco perché con un sistema NPS “sottocompensato al diminuire della frequenza”, qual’è l’NPS delle NPS-1000 Insignis la sensazione di profondità della scena acustica viene correttamente ricreata… E questo anche con segnali monofonici.

 

Questa della profondità non è una argomentazione convincente: l’apparato uditvo non dispone di strumenti per calcolare la distanza delle sorgenti e tale operazione viene fatta escusivamente sulla base delle esperienze pregresse. Per di più, di norma, le sorgenti appaiono “piccole” perché manc il contributo delle frequenze mediobasse.

 

L’EFFETTO FILTRO


Di solito, la sensazione che si prova ascoltando una performance musicale dal vivo, al confronto con quella riprodotta da un sistema Hi-Fi sia pure Hi-End è simile a quella che si prova quando togliamo gli occhiali, a maggior ragione se da sole, ma anche ove si tratta di quelli da vista.
Magari vedremo meno bene, ma è come se fra noi e il mondo che guardiamo venga eliminato un filtro che riduce comunque in una qualche misura la sensazione di tridimensionalità e soprattutto di assoluta “indipendenza” di ogni particolare da tutti gli altri e dal fondo.
Immaginiamo allora di guardare (sia pure senza occhiali) verso l’esterno dall’interno di un ambiente chiuso attraverso una grande vetrata.
Per quanto essa sia trasparente e pulita la sensazione non è mai esattamente uguale a quella che si può provare quando non c’è.

 

Tranne nel caso che il vetro venga sostituito con policarbonato cristallino


Poniamo ora fra noi e la scena che stiamo guardando, caratterizzata da tanti colori diversi, un vetro colorato.
Qualsiasi sia il colore e per quanto tenue esso sia, il suo colore si sommerà (in senso algebrico) a tutti i colori di tutti i particolari della scena che stiamo osservando modificandoli tutti nello stesso modo, ovvero applicando a tutti la stessa funzione di trasferimento.
E questa è una alterazione dello spettro luminoso naturale che viene applicata a tutta la scena, a “tutti” gli elementi che la compongono. Basta questo solo fatto per metterci in condizione di accorgerci della presenza del “filtro” anche se gli elementi che fanno parte della scena che stiamo guardando non sono da noi conosciuti in modo perfetto.
La stessa cosa avviene quando una “scena acustica” viene “filtrata” da un unico altoparlante (o un sistema di altoparlanti relativamente “semplice”).
La sua risposta in frequenza va ad alterare lo spettro di tutti gli elementi di quella scena “tutti nello stesso identico modo” rendendo evidente la presenza “degli altoparlanti” fra noi e il suono reale.
Come si potrebbe cercare di limitare e ridurre questo fenomeno?
“Semplicemente” usando tanti altoparlanti differenti per ciascun “elemento” delle stessa scena.

 

Di queste affermazioni non ci sono prove e non sarebbe difficile provare il contrario con un ragionamento per assurdo. Fissiamo prima un punto: la riproduzione richiede altoparlanti di buon qualità? Si

Ne segue che si cerca di utilizzare altoparlanti di buona qualità Idealmente si vorrà lavorare con altoparlanti “perfetti”. Gli altoparlanti “perfetti” sono tutti uguali.

 

 

Quindi, un sistema che può aiutare a ridurre “l’effetto filtro” è proprio il NPS-1000 Insignis, nel quale i vari suoni e i vari strumenti, essendo dotati di spettri acustici differenti vengono riprodotti in una percentuale, a volte molto rilevante, da gruppi di altoparlanti diversi.

 

Un sistema monovia da questo punto di vista è il peggiore.
Un sistema multivia “migliora” all’aumentare delle vie fra le quali è suddiviso lo spettro.

 


THE COCKTAIL PARTY EFFECT
L’effetto cocktail party è un interessante fenomeno che ci dice moltissimo a proposito di quanto l’attenzione può influenzare il modo in cui gli stimoli sensoriali vengono processati.
Durante una conversazione ad un party, dove si svolgono contemporaneamente un numero considerevole di altre conversazioni (miste anche a musica), noi siamo in qualche modo capaci di sintonizzarci sulla voce della persona con la quale stiamo parlando.
Tutti gli altri rumori vengono filtrati via e ignorati. Ciò generalmente accade in tutte le sensazioni: alcuni degli stimoli vengono sottratti alla analisi cosciente.
Questo ci consente di filtrare via le altre conversazioni ad un party e concentrarci esclusivamente sulla voce di una singola persona. La possibilità di riconoscere una figura rispetto allo sfondo, fenomeno ben noto nel campo delle arti visive, nel nostro caso diventa la possibilità di discriminare il suono atteso dal fondo composto da tutto ciò cui non vogliamo prestare attenzione.
Tuttavia, una cosa interessante è che se qualcuno dall’altro lato della sala ci vede e improvvisamente ci chiama usando il nostro nome, noi generalmente lo notiamo abbastanza velocemente.

 

Perché l'amigdala è sempre attiva…


Questo fa supporre che una qualche elaborazione dei segnali di fondo avviene comunque, abbastanza da farci rilevare qualche particolare di essi in certe situazioni, ad esempio se si tratta di una voce a noi familiare.
Cherry (1953) scoprì che ciò è basato su certe caratteristiche del suono che stiamo ascoltando e dalle sue differenze rispetto agli altri suoni presenti.
Nel caso della capacità di separare una voce da tutte le altre presenti nella stanza, la capacità di riuscirci dipende dalle caratteristiche del parlatore, dal suo genere, la sua intensità e la sua posizione.

 

In sostanza dalla  nostra capacità di stabilire una correlazione  tra  il pattern dello spettro  che  sintiamo con  il patter spettrale  di qualche cosa  che nella  memoria  dell'amigdale è classificato  "interessante".