A metrikus terek beágyazása az euklideszi térbe alapvető kérdés a dimenziócsökkentés és a geometriai reprezentációk szempontjából. Adott egy pontok közötti távolságokat tartalmazó mátrix T, amelynek elemei a tij távolságokat jelölik. A centírozó mátrix J segítségével a klasszikus MDS (multidimenzionális skálázás) eljárás előállítja az úgynevezett H mátrixot, melynek spektrális bontása lehetővé teszi az izometrikus beágyazást Rk dimenziójú euklideszi térbe, ahol k a H rangja. Azonban felmerül a kérdés, hogy a távolságmátrix T-nek mindig pozitív szemidefinitnek kell-e lennie, ha T egy metrikus tért definiál, azaz teljesíti a háromszög-egyenlőtlenséget.

Bizonyos esetekben a háromszög-egyenlőtlenség garantálja az izometrikus beágyazás létezését: például bármely 2 pontból álló metrikus tér triválisan beágyazható az egy dimenziós euklideszi térbe, és bármely 3 pontból álló tér is ábrázolható síkban, mint egy megfelelő oldalhosszúságú háromszög. Azonban 4 vagy több pont esetén már nem mindig létezik pontos izometrikus beágyazás. Ezt egy konkrét példával szemléltethetjük: vegyünk egy 4 pontból álló metrikus teret, ahol az első pont távolsága az összes többi ponttól 1, míg a második, harmadik és negyedik pontok egymástól mért távolsága 2. Bár a távolságok kielégítik a háromszög-egyenlőtlenséget, az ilyen pontok nem helyezhetők el semmilyen Rk térben úgy, hogy a távolságok pontosan megmaradjanak. A problémát az okozza, hogy a háromszög-egyenlőtlenség mellett a pontok elhelyezkedése geometriájában is szigorú korlátok vannak: például az egységsugarú gömbön bármely háromszög legnagyobb oldalhossza nem haladhatja meg a √3 értéket, ami kisebb, mint az itt szükséges 2. Így az adott távolságmátrixból előállított centírozott mátrix H nem lesz pozitív szemidefinit, azaz nem lesz pontos izometrikus beágyazás.

Mivel az izometrikus beágyazás nem mindig lehetséges, a klasszikus MDS algoritmust alkalmazzuk, amely megkeresi a lehető legkisebb torzulású beágyazást alacsony dimenziós euklideszi térbe (gyakran R^2 vagy R^3). Ehhez a H mátrix legnagyobb sajátértékeihez tartozó sajátvektorokat használja fel, és azok pozitív sajátértékeit. Amikor a T mátrixot grafikonokból származó távolságok határozzák meg, például egy k legközelebbi szomszédos gráf segítségével vagy ε-gömb grafikon alapján, ahol az élek súlyozottak a távolság inverzével, az eljárás az ISOMAP nevet kapja. Az ISOMAP képes megőrizni a gráfok geodetikus távolságait az alacsony dimenziós leképezésben, ami különösen fontos olyan adatok esetén, amelyek nemlineáris szerkezetűek, például körök vagy "két hold" formációk. Az ISOMAP segítségével az eredeti, nemlineárisan elkülöníthető klaszterek lineárisan szétválaszthatókká válnak, ami megkönnyíti a későbbi osztályozást.

Az eljárás alkalmazása valós adatkonvolúciókon, mint például az MNIST kézírásos számjegyek adatbázisán, jól szemlélteti, hogy a beágyazás mennyire képes megőrizni az osztályok közti elkülönítést, bár az egyes osztályok közötti átfedések is megjelennek. A metrikus MDS technikák más területeken, például társadalmi hálózatok vagy politikai könyvek közötti kapcsolatok feltárásában is alkalmazhatók, ahol a csomópontok közti távolságok nem euklideszi értelemben vett fizikai távolságok, hanem a hálózati struktúrából adódnak.

Fontos megérteni, hogy a háromszög-egyenlőtlenség megléte nem garantálja az izometrikus beágyazás létezését, különösen magasabb pontszámú metrikus terek esetén. Ez az eltérés magyarázza, miért van szükség megengedni bizonyos mértékű torzulást az alacsony dimenziós reprezentációkban, amelyet a klasszikus MDS és az ISOMAP algoritmusok kezelnek. Az ilyen eljárások célja, hogy a legfontosabb geometriai és metrikus jellemzőket megtartsák, miközben csökkentik a dimenziók számát, lehetővé téve a vizualizációt és az egyszerűbb elemzést. A beágyazás során keletkező torzulásokat és a pozitív szemidefinitség hiányát a spektrális sajátértékek vizsgálatával lehet kvantifikálni, így az elemző tudatosan kezelheti a geometriai korlátokat és az adatok szerkezetéből fakadó kompromisszumokat.

Hogyan viselkedik a távolságmátrix perturbációk és a diffúziós folyamatok gráfokon?

Tekintsünk egy súlyozott gráfot GG egy súlymátrixszal WW, melyet egy perturbált súlymátrix W~\widetilde{W} követ, amelyre fennáll az, hogy (1ε)wijw~ij(1+ε)wij(1-\varepsilon) w_{ij} \leq \widetilde{w}_{ij} \leq (1+\varepsilon) w_{ij} minden i,ji, j-re, ahol 0ε<10 \leq \varepsilon < 1. Az GG gráfhoz tartozó távolságmátrixot TT-vel, míg G~\widetilde{G}-hez tartozó távolságmátrixot T~\widetilde{T}-vel jelöljük. Ebben az esetben megmutatható, hogy a távolságmátrix egyfajta robosztusságot mutat a gráf súlyainak szorzatos perturbációjával szemben, azaz a távolságok arányosan változnak a súlyok torzításával. Kifejezetten: (1+ε)1tijt~ij(1ε)1tij(1+\varepsilon)^{ -1} t_{ij} \leq \widetilde{t}_{ij} \leq (1-\varepsilon)^{ -1} t_{ij}. Ez a viszonylagos korlátosság azt jelenti, hogy a távolságok mértéke nem torzul túlzottan, ha a gráf súlyai csak arányosan változnak.