Che cosa è lo spazio latente o latent space ed a cosa serve?

AI, INTELLIGENZA ARTIFICIALE

Lo spazio latente è  uno spazio multidimensionale astratto contenente valori caratteristici che non si possono interpretare direttamente, ma che sono  codificati in  una rappresentazione interna significativa.

Nel caso delle reti neurali, i modelli  addestrati producono come risultato uno spazio vettoriale ovvero  una rappresentazione compressa dell’informazione. La versione compressa della distribuzione dei dati viene definita spazio latente.

Molto interessante è il caso di rappresentazione del dato costruito in un modello di encoder/decoder,

in cui si comprende facilmente come il dato, ad esempio, di input viene di fatto rappresentato in uno spazio n dimensionale differente.

C’è da dire che il concetto di semplificazione o rappresentazione delle informazioni in un sistema diverso o trasformato da quello reale fa parte anche della nostra natura di esseri umani. Non è un caso, infatti, che  anche il cervello tenda a semplificare  l’informazione originale scomponendola  in informazioni facilmente utilizzabili attraverso un processo di campionamento / quantizzazione.  E’ a tutti noto,  dall’esperienza comune,   che in generale l’essere umano non è in grado di memorizzare tutte le informazioni che riceve; si considerino, ad esempio, le immagini che percepiamo ogni giorno,  delle quali siamo in grado di trattenere ed elaborare solo parti di esse.

Analogamente a noi esseri umani, che  comprendiamo un’ampia gamma di argomenti e di eventi attraverso processi di semplificazione e di rappresentazione delle informazioni acquisiste, lo spazio latente mira a fornire ad a un computer una comprensione semplificata e strutturata dell’informazione  attraverso una rappresentazione/modellazione spaziale quantitativa.

E’ molto importante comprendere, infatti, l’importanza dell’osservazione degli eventi in uno spazio latente  in quanto  grandi differenze nello spazio/eventi osservato potrebbero essere dovute a piccole variazioni nello spazio latente, in virtù di questa caratteristica  l’utilizzo di  uno spazio latente come rappresentazione della conoscenza di un modello neurale è fondamentale ed utile per  migliorarne le performance in quanto il sistema potrebbe lavorare solo su delle features principali osservando di fatto uno spazio compresso (interessante a riguardo un approfondimento della PCA).

Per comprendere meglio il concetto analizziamo alcuni esempi:

1) Spazio di embedding  (in ambito NLP): l’embedding di parole è costituito da vettori che rappresentano le singole word nello spazio latente nel quale parole simili nel significato (semantico) sono rappresentati da vettori la cui distanza è minima o che  giacciono  vicini l’uno all’altro. La distanza semantica viene, infatti, calcolata utilizzando come metodo di calcolo la distanza del  coseno o quella  euclidea, di  conseguenza parole che non sono correlate si trovano distanti tra di loro. Per avere una rappresentazione visiva dello spazio è molto interessante analizzare l’embedding projector di tensorflow che fornisce una buona idea del concetto di spazio latente attraverso la  visualizzazione dello spazio di embedding in tre dimensioni, supponendo, pertanto, di aver ridotto la codifica n dimensionale di una parola nelle Principle Componet che mi permettono di rappresentare il singolo dato in uno spazio tridimensionale.

2) Spazio delle caratteristiche dell’immagine:  nella classificazione delle immagini che usano le CNN è possibile estrarre delle informazioni che rappresentano le stesse attraverso delle features ridotte o trasformate; per un dettaglio maggiore magari sarebbe interessante rileggere il questo articolo.

3) Metodi di modellazione degli argomenti come LDA , PLSA utilizzano approcci statistici per ottenere uno spazio latente di riferimento attraverso l’osservazione  di un insieme di documenti e della distribuzione delle parole.

4) VAE e  GAN infine mirano ad ottenere uno spazio  latente che si avvicini molto allo spazio reale dei dati osservati, per costruire versioni simili o similari delle immagini di riferimento.

In tutti gli esempi precedenti l’obiettivo è di individuare  un modo di rappresentare i dati in uno  spazio di osservazione/latente  multidimensionale relativamente più semplice di quello reale, con lo scopo di  approssimare lo spazio latente reale dei dati osservati.

 

 

Se vuoi farmi qualche richiesta o contattarmi per un aiuto riempi il seguente form

    Comments