Introduzione alle Basi Ortonormali

Una massa di informazioni, così come sono, non dicono molto a chi non possiede:

  1. un quadro di riferimento, cioè concetti, modelli, categorie, scale, unità di misura, criteri di confronto; i punti luminosi formati dalle stelle sono sempre lì, ma solo quando li colleghiamo secondo disegni che ci ricordano figure note possono diventare un riferimento per orientarci;
  2. altre prospettive, poiché un punto di vista può mettere in luce relazioni, un altro può evidenziare variazioni, un altro ancora può mostrare simmetrie o anomalie;
  3. discernimento, per scegliere il riferimento più adatto, la prospettiva più illuminante, la rappresentazione più efficace; è ciò che distingue l’analisi meccanica dalla comprensione profonda per sintetizzare senza perdere l’essenziale, per cogliere relazioni che non erano evidenti, per trarre conseguenze affidabili, per costruire nuova conoscenza; a volte serve una visione globale altre volte una locale, a volte conviene semplificare altre complicare, a volte è utile proiettare in un ambito più piccolo altre in uno più grande.

Le informazioni, i dati, vengono registrati spesso come vettori o funzioni. Quello delle basi ortonormali costituisce il vocabolario e la grammatica universale per rappresentarli in uno spazio.
La teoria delle basi ortonormali, pilastro fondamentale dell'algebra lineare, dell'analisi funzionale e della fisica teorica, fornisce tecniche per selezionare un sistema di coordinate intrinsecamente pulito ed efficiente, essenziale per scomporre problemi complessi in componenti indipendenti e gestibili. Molte tecniche di analisi dati, come la trasformata di Fourier, la Principal Component Analysis o le wavelet, in sostanza coincidono con la scelta di una base particolarmente adatta alla struttura dei dati o all’operatore che li genera.

Una base è un insieme di vettori minimale che generano l'intero spazio a cui appartengono e, in uno spazio dotato di un prodotto interno (o prodotto scalare), formano una base ortogonale quando a due a due il loro prodotto interno è nullo. Se, per di più, il prodotto interno di ogni vettore con se stesso è unitario la base è detta ortonormale.
L'ortogonalità garantisce l'indipendenza statistica e algebrica, così l'informazione contenuta in un vettore di una base ortogonale è completamente disaccoppiata dalle informazioni contenute negli altri vettori della base.

Le coordinate di ogni vettore relativamente a una base ortonormale si ottengono in modo estremamente semplice anziché risolvere sistemi lineari complessi.

Ad esempio, nello spazio dei segnali periodici nel tempo una base ortogonale è costituita dalle funzioni trigonometriche \(\{1,\sin(t), \cos(t),\sin(2t), \cos(2t),\sin(3t), \cos(3t),\dots\}\) così che ogni segnale si scompone in modo unico in una somma pesata di queste funzioni, la Serie di Fourier, dove ciascun peso quantifica l'ampiezza di una specifica frequenza. Questo trasforma il segnale dal dominio del tempo al dominio della frequenza, essenziale nell'elaborazione dei segnali e nella fisica ondulatoria.

Problemi complessi, come le equazioni differenziali alle derivate parziali per la diffusione del calore o la propagazione delle onde, vengono spesso risolti esprimendo la soluzione come una serie pesata dei elementi di una base ortogonale trasformando un problema di analisi in un problema algebrico di ricerca dei pesi.
Anche in applicazioni come la compressione di immagini o audio si scompone il dato in una base ortogonale come quella realtiva alla Trasformata del Coseno Discreta. Poiché le componenti non informative sono disaccoppiate dalle altre, possono essere eliminate senza influenzare significativamente le componenti chiave, permettendo un'efficiente compressione.

A seconda di come si definisca il prodotto interno tra funzioni si possono definire basi ortogonali composte da elementi come i Polinomi di Legendre , cruciali in elettrostatica e nella risoluzione dell'equazione di Laplace, o i Polinomi di Chebyshev, i cui coefficienti sono intimamente legati ai coefficienti delle passeggiate aleatorie e all'analisi armonica sferica in dimensioni superiori.

Il Data Mining è il processo di scoperta di modelli nascosti, di correlazioni e di anomalie in grandi set di dati utilizzando tecniche di apprendimento automatico, di statistica e relative ai database. Qui l’uso delle basi ortonormali è nascosto dietro tecniche come la Principal Component Analysis (PCA), Singular Value Decomposition (SVD), la traformata di Fourier o le Wavelet transform; serve in sostanza a rappresentare i dati in uno spazio dove informazione e rumore sono separabili in modo controllato, ovvero trasformare dati complessi in coordinate informative e interpretabili.
Ciò perché una base ortonormale consente di:

Bibliografia