All’inizio degli anni ’90, il neuroscienziato britannico Karl Friston stava studiando attentamente le scansioni cerebrali. Le scansioni hanno prodotto terabyte di output digitale e Friston ha dovuto trovare nuove tecniche per ordinare e classificare gli enormi flussi di dati.
Lungo la strada ha avuto una rivelazione. Le tecniche che stava usando potrebbero essere simili a ciò che il cervello stesso stava facendo quando elaborava i dati visivi.
Potrebbe essere che si fosse imbattuto in una soluzione a un problema di ingegneria dei dati che la natura aveva scoperto molto tempo fa? Il momento eureka di Friston ha portato a una “teoria del tutto”, che pretende di spiegare il comportamento del cervello, della mente e della vita stessa.
Come abbiamo scoperto quando abbiamo messo insieme una raccolta di articoli , la teoria – nota come “principio dell’energia libera” – è controversa tra scienziati e filosofi.
Reingegnerizzare la natura
L’idea iniziale di Friston era allettante perché il problema che deve affrontare il cervello è simile a quello che deve affrontare uno scienziato sperimentale. Entrambi devono utilizzare i dati in loro possesso per trarre conclusioni su eventi che non possono osservare direttamente.
Il neuroscienziato usa i dati di scansione per dedurre fatti sui processi cerebrali. Il cervello utilizza input sensoriali per dedurre fatti sul mondo esterno.
L’algoritmo utilizzato da Friston per trarre conclusioni dai suoi dati – un’operazione matematica chiamata “ridurre al minimo l’energia libera” – si basava su tecniche esistenti nell’analisi statistica .
Friston (e altri come l’informatico Geoff Hinton ) si resero conto che le reti neurali artificiali potevano facilmente eseguire questa operazione. E se le reti neurali artificiali potessero farlo, forse potrebbero farlo anche le reti neurali biologiche.
Ma Friston non si è fermato qui. Ha ragionato che il problema di trarre conclusioni da informazioni limitate è un problema affrontato da tutti gli esseri viventi.
Questo lo ha portato al “ principio dell’energia libera ”: che ogni essere vivente, ovunque, riduce al minimo l’energia libera.
Il principio dell’energia libera
Il principio dell’energia libera e l’inferenza attiva
Ciò implica che la riduzione dell’energia libera riduce ulteriormente la sorpresa del modello dell’agente, limitando la sua esistenza a un insieme limitato di convinzioni ambite. Il principio dell’energia libera ha avuto origine dal lavoro di von Helmholtz sull'”inferenza inconscia” [57], postulando che gli esseri umani inevitabilmente eseguono l’inferenza per eseguire la percezione.
Ciò implica che il sistema percettivo umano adegua continuamente le credenze sugli stati nascosti del mondo in modo inconscio. La formulazione variazionale dell’energia libera [1,58], insieme all’introduzione di azioni come parte del processo di inferenza, ha ampliato il principio originale dell’energia libera portando allo sviluppo dell’inferenza attiva.
Nella Figura 2, illustriamo l’interazione tra i principali fattori che determinano il processo di percezione incarnata come descritto nell’inferenza attiva. In ogni momento, l’ambiente si trova in un certo stato η, che è esterno all’agente e non direttamente osservabile. L’agente interagisce con l’ambiente in due modi: o attraverso la percezione sensoriale (passiva), che è caratterizzata dall’osservazione di stati sensoriali o, o mediante azioni, che possono essere espresse come un insieme di stati attivi a che l’agente impone all’organismo ambiente.
Fondamentalmente, questi stati interni non devono essere isomorfi a quelli esterni, poiché il loro scopo è spiegare gli stati sensoriali in accordo con stati attivi, piuttosto che replicare l’esatta dinamica dell’ambiente L’isomorfismo, in questo contesto, si riferisce alla considerazione di una struttura- preservare la mappatura dello spazio statale.
Secondo l’inferenza attiva, gli stati interni e ambientali non sono necessariamente uguali e il modo in cui sono organizzati gli stati interni può anche differire da agente ad agente, pur dovendo avere a che fare con concetti/osservazioni/stati sensoriali simili. Da una prospettiva biologica, ciò trova evidenza nel fatto che diversi sistemi viventi hanno sviluppato organi/tessuti diversi lungo il loro processo evolutivo [16].
Il ruolo della rappresentazione interna dello stato è, infatti, quello di fornire le statistiche sufficienti che consentano una “ipotesi migliore” sulle cause delle osservazioni dell’agente e la selezione di politiche di azione adattativa [59].
Come conseguenza della minimizzazione dell’energia libera, l’agente possiede convinzioni sul processo che genera risultati, ma anche sulle politiche di azione che portano a generare tali risultati [60]. Ciò corrisponde a un modello probabilistico di come vengono causate le sensazioni e di come gli stati dovrebbero essere attivamente campionati per guidare la generazione di dati sensoriali nell’ambiente.
A causa di questi presupposti, il concetto di “ricompensa” nell’inferenza attiva è molto diverso dai premi in RL, poiché i premi non sono segnali utilizzati per attirare traiettorie, ma piuttosto stati sensoriali che gli agenti mirano a visitare frequentemente per ridurre al minimo la sua energia libera [61].
Da una percezione ingegneristica, questa differenza si riflette nel fatto che le ricompense in RL fanno parte dell’ambiente e, quindi, ogni ambiente dovrebbe fornire il suo segnale di ricompensa unico, mentre nell’inferenza attiva le “ricompense” sono intrinseche all’agente, che perseguirebbe le sue preferenze in qualsiasi ambiente, sviluppando un insieme di stati più frequentemente visitati.
Nel resto di questa sezione, discutiamo come il modello probabilistico dell’agente per la percezione e l’azione viene appreso riducendo al minimo l’energia libera, fornendo una sintesi matematica. Consideriamo l’ambiente come un processo decisionale di Markov parzialmente osservabile (POMDP), rappresentato nella Figura 3.
Usando pedici per specificare i passi temporali discreti, indichiamo l’osservazione o il risultato al tempo t con ot. Per indicare sequenze che si estendono su un numero indefinito di passi temporali, utilizziamo l’apice ∼, cioè per i risultati o˜={o1,o2,…,ot}. La successione degli stati s˜={s1,s2,…,st} è influenzata da sequenze di azioni, o politiche, che indichiamo con π=a˜={a1,a2,…,at}.
La parametrizzazione della mappatura della verosimiglianza stato-risultato è indicata con θ. Un parametro di precisione ζ influenza la selezione dell’azione funzionando come una temperatura inversa rispetto alle politiche.
La sezione è divisa in due parti: la prima spiega come il modello interno viene appreso rispetto all’esperienza passata, minimizzando un funzionale variazionale di energia libera che spiega la dinamica degli esiti dell’ambiente, data una sequenza di azioni. Nella seconda parte, discutiamo la minimizzazione dell’energia libera attesa rispetto al futuro, quando vengono selezionate le azioni per ridurre la sorpresa rispetto ai risultati preferiti dell’agente. È importante sottolineare che il nostro trattamento si riferisce a un’istanza a tempo discreto dell’inferenza attiva. Per una discussione sul tempo continuo, il lettore può fare riferimento a [34].
link di riferimento: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8871280/#:~:text=The%20free%20energy%20principle%20originated,world%20in%20an%20unconscious%20way.
Niente sorprese?
Ridurre al minimo l’energia libera significa scegliere di credere nella situazione inosservata che rende le tue osservazioni meno sorprendenti.
Ecco un esempio: immagina di fare un picnic nel parco, guardando due amici che calciano un pallone avanti e indietro. La tua visuale è occlusa da un albero, quindi non vedi l’intera traiettoria del pallone calciato.
Ora, è possibile che ci sia una terza persona dietro l’albero, che prende la palla ogni volta che gli passa e poi lancia una palla di riserva che ha a portata di mano.
Tuttavia, non ci sono prove dell’esistenza di questa terza persona, quindi la loro esistenza sarebbe molto sorprendente. Quindi puoi ridurre al minimo la tua sorpresa credendo che non ci sia una terza persona segreta dietro l’albero.
Anche la riduzione al minimo dell’energia gratuita può aiutare a guidare le nostre azioni. Secondo il principio dell’energia libera, dovresti fare cose che cambieranno il mondo in modo tale che le tue esperienze abbiano meno probabilità di essere sorprendenti!
Visto da questa prospettiva, mangiamo per evitare la sorpresa della fame estrema e cerchiamo riparo per evitare la sorpresa del freddo.
Quanto spiega effettivamente una “teoria del tutto”?
Quindi il principio dell’energia libera è una “teoria del tutto” che abbraccia neuroscienze, psicologia e biologia! Ma non tutti sono convinti che sia un’idea utile.
Parte dello scetticismo riguarda se la teoria sia vera o meno. Una preoccupazione ancora più grande è che, anche se è vero, potrebbe non essere molto utile.
Ma perché la gente dovrebbe pensare questo?
Il biologo della popolazione americano Richard Levins ha notoriamente delineato un dilemma che deve affrontare gli scienziati che studiano i sistemi biologici.
Questi sistemi contengono un’enorme quantità di dettagli potenzialmente importanti e quando li modelliamo non possiamo sperare di catturarli tutti. Quindi, quanti dettagli dovremmo tentare di catturare e quanto dovremmo tralasciare?
Levins ha concluso che esiste un compromesso tra il livello di dettaglio in un modello e il numero di sistemi a cui si applica. Un modello che cattura molti dettagli su un sistema specifico sarà meno informativo su altri sistemi simili.
Ad esempio, possiamo modellare la tecnica di un nuotatore olimpico per migliorarne le prestazioni. Ma quel modello non rappresenterà fedelmente un altro nuotatore.
D’altra parte, un modello che copre più sistemi sarà meno informativo su qualsiasi sistema particolare. Modellando il modo in cui nuotano gli esseri umani in generale, possiamo progettare lezioni di nuoto per bambini, ma le differenze individuali tra i bambini verranno ignorate.
La morale è che i nostri modelli dovrebbero adattarsi ai nostri obiettivi. Se vuoi spiegare il funzionamento di un particolare sistema, produci un modello altamente specifico. Se vuoi dire cose su molti sistemi diversi, crea un modello generale.
Troppo generico per essere utile?
Il principio dell’energia libera è un modello molto generale. Potrebbe anche essere il modello più generale nelle scienze della vita di oggi.
Ma quanto sono utili tali modelli nella pratica quotidiana della biologia o della psicologia? I critici sostengono che la teoria di Friston sia così generale che è difficile vedere come potrebbe essere messa in pratica.
I fautori rivendicano successi per il principio dell’energia libera, ma si rivelerà un enorme passo avanti? O le teorie che cercano di spiegare tutto finiscono per non spiegare nulla?
Autore: Ross Pain , Michael David Kirchhoff e Stephen Francis Mann
Fonte: The Conversation