I modelli di diffusione, recentemente molto discussi nel panorama scientifico e ingegneristico, offrono un approccio innovativo per la generazione di dati, sia in contesti di generazione unilaterale che condizionale. Il loro utilizzo si è esteso a numerose applicazioni pratiche, come la creazione di contenuti basati sull'intelligenza artificiale, tra cui strumenti popolari come GPT, DALL-E, e SORA, che generano testo, immagini e video in risposta a prompt degli utenti. Nonostante i modelli di diffusione abbiano trovato ampio impiego, la comprensione della loro applicazione in problemi inversi, come quelli comuni nell'ingegneria meccanica, rimane relativamente meno esplorata.

Nel cuore di un modello di diffusione condizionale vi è un processo che trasforma campioni da una distribuzione di probabilità trattabile in campioni che rappresentano una distribuzione sconosciuta, quella che descrive i dati reali o le condizioni non osservate. A differenza di altri modelli generativi, il modello di diffusione condizionale adotta un approccio a più fasi. Questo lo rende particolarmente adatto a risolvere problemi complessi che richiedono inferenze da distribuzioni condizionali, come il calcolo di proprietà microstrutturali di materiali o la stima di condizioni iniziali in problemi termici.

I modelli di diffusione, simili ad altri modelli generativi, si basano su reti neurali per trasformare i campioni da una distribuzione trattabile a una distribuzione sconosciuta. Tuttavia, in un modello di diffusione, questo processo avviene tramite un processo stocastico che evolve nel tempo. Il modello inizia con una distribuzione iniziale di dati (ad esempio, una distribuzione normale multivariata) e, attraverso un processo di diffusione che altererà progressivamente i dati, genera nuove realizzazioni che sono rappresentative di una distribuzione sconosciuta, denominata pdatap_{\text{data}}. L'evoluzione di questa distribuzione è modellata da un'equazione differenziale parziale che rappresenta il processo stocastico al quale è sottoposta la distribuzione di probabilità.

La trasformazione inversa, che è altrettanto fondamentale, consente di risalire dalla distribuzione finale pTp_T a quella iniziale p0p_0, partendo da campioni che seguono una distribuzione normale multivariata, per ricostruire dati che possano essere interpretati come campioni "realistici" o veri della distribuzione desiderata. Questo processo è possibile attraverso una serie di equazioni differenziali ordinarie, come la probabilità del flusso, che permette di evolvere il campione "inversamente" nel tempo, restituendo gradualmente il dato di partenza.

Una delle caratteristiche più attraenti dei modelli di diffusione condizionale è la loro versatilità: grazie alla loro natura simulativa, sono in grado di gestire fenomeni complessi anche in presenza di rumore non-Gaussiano, il che li rende estremamente utili per l'analisi di sistemi reali che non seguono modelli semplici. Inoltre, il fatto che il processo di apprendimento possa essere applicato a coppie di campioni derivati da simulazioni forward significa che i modelli di diffusione condizionale possono essere adattati e riutilizzati in contesti diversi, riducendo il bisogno di costose e ripetitive simulazioni.

Nel campo della meccanica, i modelli di diffusione condizionale si rivelano un potente strumento per risolvere problemi inversi di alta dimensione. La loro capacità di inferire condizioni iniziali, come nel caso della generazione di microstrutture di materiali, apre nuovi orizzonti per la progettazione e l'ottimizzazione di materiali con proprietà specifiche. Inoltre, essendo modellati da equazioni differenziali parziali, essi sono particolarmente adatti per essere integrati con altri metodi numerici avanzati che trattano fenomeni meccanici complessi. La possibilità di applicarli a problemi che coinvolgono rumori e perturbazioni complesse, non solo Gaussiani, rappresenta un ulteriore vantaggio in molti contesti pratici.

In sintesi, l'introduzione dei modelli di diffusione condizionale nell'analisi dei problemi inversi consente di applicare approcci moderni e altamente adattabili a fenomeni fisici complessi. La loro applicazione può essere vista come una risposta a sfide ingegneristiche che richiedono una comprensione approfondita di sistemi non-lineari e multi-dimensionali. Con un potenziale di adattamento che si estende a vari domini e una flessibilità che li rende efficaci in contesti diversi, questi modelli sono destinati a diventare strumenti indispensabili per i professionisti e i ricercatori nel campo della meccanica e dell'ingegneria avanzata.

Come si ricostruiscono le proprietà del mezzo e la funzione sorgente tramite le onde acustiche in presenza di bolle risonanti?

Il modello matematico che descrive il comportamento delle onde acustiche in un mezzo eterogeneo, nel quale viene introdotta una bolla risonante, si basa su un sistema di equazioni alle derivate parziali di tipo iperbolico, con condizioni di trasmissione sulla frontiera dell’inclusione. In particolare, la velocità d’onda all’interno della bolla assume un valore costante definito come c1=k1c_1 = k_1, mentre la densità di massa, che presenta un salto discontinuo sull’interfaccia D\partial D, determina una condizione di continuità per la funzione d’onda e una condizione di salto per la sua derivata normale.

Il problema diretto è formulato attraverso un problema ai valori iniziali (IVP) con sorgente attiva e condizioni al contorno di trasmissione, e la sua analisi richiede la rappresentazione integrale tramite la funzione di Green associata all’operatore iperbolico. Questa funzione è strettamente connessa al concetto di metrica riemanniana definita dalla velocità d’onda variabile c0(x)c_0(x), da cui deriva una nozione di funzione di tempo di viaggio ζ(x,y)\zeta(x,y), che misura il tempo necessario a un segnale per propagarsi da un punto yy a un punto xx.

L’ipotesi fondamentale di unicità delle geodetiche tra punti nel dominio Ω\Omega e della convessità rispetto a queste geodetiche garantisce la struttura singolare della funzione di Green, che si manifesta come una distribuzione singolare in tempo e spazio, accompagnata da un termine regolare nullo prima del tempo di arrivo del segnale. La formula di espansione progressiva della funzione di Green permette di esprimere la risposta del sistema come somma di termini singolari localizzati al tempo di volo e termini più regolari.

La presenza della bolla introduce un contrasto nei campi d’onda che può essere descritto da un’espansione asintotica rispetto al parametro di piccola scala aa che misura la dimensione dell’inclusione. I primi quattro termini dominanti di questa espansione, di ordine lineare in aa, rappresentano la parte principale del segnale di contrasto misurato in un punto di rilevamento fisso x0Ωx_0 \in \partial \Omega.

La frequenza di risonanza della bolla, nota come frequenza di Minnaert ωM(z)\omega_M(z), è un parametro critico che dipende dalla densità di massa locale e da una costante geometrica positiva ADA_{\partial D}. Tale frequenza determina la sensibilità del mezzo alla presenza della bolla e quindi l’efficacia degli agenti di contrasto nella rivelazione delle proprietà del mezzo.

Il problema inverso consiste nel ricostruire, a partire dalle misure raccolte in un unico punto sulla frontiera per un intervallo di tempo sufficientemente lungo, le proprietà fisiche del mezzo, ossia la densità ρ(x)\rho(x), il modulo di compressibilità k(x)k(x), e la sorgente passiva J(x,t)J(x,t). L’equilibrio tra dimensioni dello spazio delle misure (3D spaziali + 1D temporale) e delle incognite rende il problema determinato, senza essere sovradeterminato, e pertanto teoricamente risolvibile.

La strategia risolutiva si basa sull’espressione del campo d’onda di contrasto w(x0,t)w(x_0, t) come somma di un termine dominante lineare in aa e di un operatore di convoluzione KK applicato alla funzione v(z,t)v(z, t), che rappresenta il campo d’onda nel punto zz della bolla. Tale equazione integrale è invertibile, permettendo così di estrarre da dati sperimentali il campo v(z,t)v(z, t) con un errore controllato di ordine superiore rispetto a aa.

La precisione della ricostruzione è garantita da regolarità elevate delle funzioni fisiche e delle sorgenti, che assicurano la continuità e la differenziabilità del campo nel tempo. Inoltre, il termine wdw_d del campo d’onda di contrasto presenta una struttura temporale con supporto limitato a partire dal tempo di arrivo ζ(x0,z)\zeta(x_0,z), confermando la localizzazione temporale della risposta acustica indotta dalla bolla.

Oltre alla complessità tecnica della formulazione e delle ipotesi matematiche, è importante comprendere che la modellizzazione si basa su un equilibrio delicato tra le proprietà fisiche locali del mezzo e la geometria dell’inclusione. L’interpretazione delle misure richiede quindi una profonda conoscenza della propagazione delle onde in mezzi disomogenei e della natura delle risonanze indotte da agenti di contrasto. Questo approccio apre la strada a tecniche di imaging acustico non invasive, con applicazioni in diagnostica medica e nel controllo non distruttivo.

Per completare la comprensione, occorre inoltre considerare la sensibilità del sistema alle perturbazioni e il ruolo delle condizioni iniziali e al contorno nella stabilità della soluzione. La teoria sviluppata si applica in regime lineare e richiede che i parametri del mezzo e le sorgenti siano sufficientemente regolari per garantire l’esistenza e unicità delle soluzioni. Infine, l’uso di una sola posizione di misura limita le informazioni spaziali acquisite, richiedendo una modellizzazione accurata del tempo di viaggio e delle funzioni di Green per ottenere una ricostruzione efficace.

Qual è l'importanza della topologia debole nei problemi inversi con dati infiniti?

Consideriamo una funzione continua f:(X,τX)(Y,τY)f: (X, \tau_X) \rightarrow (Y, \tau_Y), tra due spazi topologici. Una funzione ff è continua se, e solo se, per ogni insieme aperto VV di YY, l'insieme f1(V)f^{ -1}(V) è un insieme aperto di XX. Passando al nostro problema inverso delle autovalutazioni (con dati infiniti), indichiamo con SS l'insieme di tutte le sequenze infinite {a1,a2,}\{a_1, a_2, \dots\} di numeri reali. Introduciamo la mappa φ:CHS\varphi : CH \rightarrow S, definita come φ(q)={λ1(q),λ2(q),}λ(q)\varphi(q) = \{ \lambda_1(q), \lambda_2(q), \dots \} \equiv \lambda(q), e denotiamo φ(CH)=SHS\varphi(CH) = SH \subset S. Supponiamo che il problema inverso infinito abbia una soluzione unica. Il nostro obiettivo è invertire φ\varphi e determinare ψ=φ1\psi = \varphi^{ -1}, con ψ:SHCH\psi: SH \rightarrow CH, tale che ψ(λ(q))=q\psi(\lambda(q^*)) = q^* per dati spettrali dati da λ(q)={λ1(q),λ2(q),}\lambda(q^*) = \{\lambda_1(q^*), \lambda_2(q^*), \dots\}. In particolare, desideriamo che la funzione ψ\psi sia continua, affinché piccole variazioni nei dati spettrali producano piccoli cambiamenti nel coefficiente, ossia, per ogni insieme aperto VV di CHCH, l'insieme ψ1(V)\psi^{ -1}(V) deve essere un insieme aperto di SHSH.

È evidente che la possibilità di avere la funzione ψ\psi continua aumenta con la riduzione del numero di insiemi aperti in CHCH, e questo spiega, in modo euristico, l'interesse di rendere la topologia di CHCH sempre più debole. Definiamo una topologia su SHSH utilizzando il criterio di convergenza componente per componente: per una sequenza {qj}CH\{q_j\} \subset CH e qCHq^* \in CH, si dice che limjλ(qj)=λ(q)\lim_{j \to \infty} \lambda(q_j) = \lambda(q^*) se, per ogni n1n \geq 1, limjλn(qj)=λn(q)\lim_{j \to \infty} \lambda_n(q_j) = \lambda_n(q^*). In CHCH, definiamo la topologia più debole in cui tutte le autovalutazioni sono funzioni continue del potenziale, ossia, limjqj=q\lim_{j \to \infty} q_j = q^* se, per ogni n1n \geq 1, limjλn(qj)=λn(q)\lim_{j \to \infty} \lambda_n(q_j) = \lambda_n(q^*).

Considerando l'analisi del problema inverso finito, che non può essere risolto in modo unico, siamo portati a introdurre la seguente definizione: una sequenza {qN(x)}CH\{q_N(x)\} \subset CH interpola ai dati spettrali {λn(q)}\{\lambda_n(q^*)\} se, per ogni NN, esiste un ϵN\epsilon_N tale che λn(qN)λn(q)<ϵN|\lambda_n(q_N) - \lambda_n(q^*)| < \epsilon_N per ogni n=1,,Nn = 1, \dots, N, con limNϵN=0\lim_{N \to \infty} \epsilon_N = 0.

Il seguente teorema, dovuto a Barnes (1991), evidenzia l'importanza di avere una sequenza di coefficienti che interi. Supponiamo che il problema delle autovalutazioni infinite abbia una soluzione unica per dati spettrali dati {λn(q)}\{\lambda_n(q^*)\}. Se {qN(x)}CH\{q_N(x)\} \subset CH è una sequenza che interi ai dati {λn(q)}\{\lambda_n(q^*)\}, allora limNqNq1Max=0\lim_{N \to \infty} \|q_N - q^*\|_{1\text{Max}} = 0. Questo teorema mostra che una sequenza di coefficienti che interi converge, e che i dati infiniti (sufficienti per garantire l'unicità) contengono una approssimazione uniforme di qq^*. I risultati di Hald e McLaughlin mostrano che i dati infiniti contengono ben più di questo. Tuttavia, per ottenere un'approssimazione puntuale di q(x)q^*(x), l'approssimazione uniforme deve essere differenziata una volta. Purtroppo, il teorema non si applica al problema inverso finito, per il quale i dati disponibili non sono sufficienti per scegliere un NN abbastanza grande.

I teoremi 1 e 2 forniscono una sorta di “basso” e “alto” approssimato dei limiti inferiori e superiori delle informazioni contenute nei dati spettrali finiti e infiniti. In questo senso, il Teorema 1 è una prima approssimazione grezza della topologia più debole di CHCH in cui tutte le autovalutazioni sono continue.

Man mano che il coefficiente qq diventa più regolare, possiamo costruire topologie più deboli su CHCH in cui tutte le autovalutazioni sono continue. Ad esempio, sia CH,VCH,V l'insieme delle funzioni qCHq \in CH che hanno una variazione totale al massimo pari a VV. In tal caso, esiste una costante K(n,H,V)K(n, H, V) tale che per ogni q1,q2CH,Vq_1, q_2 \in CH,V, si ha:

λn(q1)λn(q2)K(n,H,V)q1q23Max.|\lambda_n(q_1) - \lambda_n(q_2)| \leq K(n, H, V) \|q_1 - q_2\|_{3\text{Max}}.

Questa disuguaglianza ci dice che una quantità finita di dati può produrre, al massimo, una approssimazione uniforme di una funzione, mentre per ottenere un'approssimazione puntuale è necessario differenziare questa approssimazione uniforme più volte. Per le funzioni qCH,Vq \in CH,V con q(x)L|q'(x)| \leq L, si può dimostrare che:

λn(q1)λn(q2)K(n,H,V,L)q1q23L1.|\lambda_n(q_1) - \lambda_n(q_2)| \leq K(n, H, V, L) \|q_1 - q_2\|_{3L1}.

In conclusione, il comportamento di una funzione di potenziale q(x)q(x) è strettamente legato alla regolarità delle sue autovalutazioni e alla scelta della topologia giusta. Se il coefficiente q(x)q(x) è più regolare, possiamo utilizzare topologie più deboli, consentendo una maggiore continuità nelle relazioni tra i dati spettrali e i coefficienti, un aspetto fondamentale per la risoluzione di problemi inversi complessi.