Generelle store språkmodeller (LLM) har vist imponerende evne til å generalisere til ulike domener som en nullskudd-tilnærming. Imidlertid lider de fortsatt under utfordringer knyttet til relevans og spesifisitet i sensitive domener, og kan ofte "hallusinere" informasjon når de blir tvunget til å generere kritiske data uten tilstrekkelig kontekst. I medisinsk sammenheng er personvernhensyn en betydelig utfordring for å trene slike modeller med beskyttede helsedata, noe som gjør at deres anvendelse i kliniske arbeidsflyter kan være problematisk, spesielt for mindre erfarne brukere. I denne sammenhengen kan utviklingen av domene-spesifikke modeller bidra til å løse flere av de problemene som oppstår ved bruk av generelle LLM-er i sensitive domener.

En av de viktigste fordelene med domene-spesifikke modeller er at de kan tilpasses de spesifikke behovene i helsesektoren, som for eksempel prostatakreft. Gjennom vår tilnærming har vi utviklet et rammeverk som gjør det mulig å trene en spesialisert LLM for prostatakreft ved hjelp av deidentifiserte kliniske dataene. Denne tilnærmingen inkluderer flere viktige steg, som design av spesialiserte tokenizere, nøye kuratering av data, og selv-supervisert to-fase trening. Dette rammeverket har vist seg å gi bedre resultater enn både generelle LLM-er som GPT-2 og spesialiserte modeller som BioGPT for oppgaver relatert til klinisk prediksjon.

I vår forskning har vi demonstrert hvordan en liten LLM (124 millioner parametre) kan overgå både GPT-2 (som er av samme størrelse) og BioGPT (som er tre ganger større) i fire forskjellige nedstrømsoppgaver, til tross for at BioGPT er spesialdesignet for biomedisin. En av de viktigste årsakene til denne forbedringen er utviklingen av en spesialisert tokenizer, som er i stand til å forstå og fokusere på domene-spesifikke begreper uten å dele dem opp i semantisk feilaktige tokens. For eksempel er kliniske termer som "erektil dysfunksjon", "primær ondartet neoplasma" og "prostatisk hypertrofi" bedre håndtert av vår tokenizer enn av BioGPT-tokenizeren, som ikke er like tilpasset prostatakreftspesifikke termer.

Videre har vi undersøkt hvordan vårt spesialiserte LLM kan anvendes i pasientopplæring gjennom et interaktivt spørsmåls- og svarsystem. Selv om vi testet modellen på spørsmål hentet fra den offentlige nettsiden til American Cancer Society, har vårt LLM aldri blitt eksplisitt trent på disse tekstene. Likevel overgikk det GPT-2 med god margin på alle evalueringskriterier, da GPT-2 ofte genererte generiske eller irrelevante svar. BioGPT, derimot, genererte for det meste relevante svar, men som regel manglet det nøyaktighet i spesifik informasjon om behandlinger. For eksempel, når det ble spurt om bivirkninger ved bisfosfonater, svarte BioGPT med medisiner som ikke var relevante for spørsmålet.

Når det gjelder klinisk prediksjon av behandlingskategorier, viste de domene-spesifikke modellene bedre ytelse enn generiske LLM-er og BioGPT for tre av fem behandlingskategorier. I enkelte tilfeller, som når pasientene ble anbefalt kurativ behandling som stråling eller kirurgi, viste modellene svakere resultater, ettersom slike beslutninger ofte ikke kan fastslås utelukkende basert på klinisk historikk. Til tross for dette var vår modell fortsatt i stand til å gjøre bedre prediksjoner enn BioGPT.

En annen viktig anvendelse for spesialiserte LLM-er i helsesektoren er oppgavene knyttet til samsvarsdeteksjon, særlig når det er få treningsdata tilgjengelig. I et scenario med få eksempler på trening, viste PCaMLM (vår spesialiserte modell) en betydelig bedre ytelse enn både GPT-2 og BioGPT i oppgaver som krevde forutsigelse av spesifikke kliniske termer og behandlingsbeslutninger. Dette kan være et nyttig verktøy for å forhindre generering av feilaktig informasjon i kliniske systemer, som er et voksende problem med generelle LLM-er.

En stor utfordring i medisinsk maskinlæring har vært tilgangen til tilstrekkelige mengder kliniske data som kan brukes til trening av modeller. Siden mye av helsedataene er beskyttet av personvernlovgivning, er det vanskelig å bruke denne informasjonen i stor skala. Dette gjør det vanskelig å utvikle modeller som kan forstå de spesifikke nyansene i kliniske beslutninger. Vårt rammeverk, som fokuserer på bruk av deidentifiserte kliniske notater, radiologi- og patologirapporter, kan være en løsning på dette problemet. Det gir en mulighet til å trene modeller på reelle kliniske data, og ikke bare på offentlig tilgjengelige medisinske publikasjoner.

En av de viktigste innsiktene her er at, til tross for den økte bruken av store generelle LLM-er i helsesektoren, er spesialiserte domene-modeller fortsatt nødvendige for å forstå og anvende kompleks medisinsk informasjon på en nøyaktig og relevant måte. Denne spesialiseringen kan gjøre det mulig for modeller å tilby mer presise, relevante og sikre anbefalinger i helsesystemet, noe som kan ha stor betydning for både pasientbehandling og forskning.

Hvordan Diffusjons-Spekter-Bilding (RSI) Forbedrer Kreftdiagnostikk

Diffusjons-Spekter-Bilding (RSI) er en avansert MR-teknologi som skiller mellom fri, hindret og begrenset diffusjon i vev, og gir dermed en mer presis forståelse av vevets cellulære struktur. Denne teknikken er spesielt nyttig i studier av heterogene vev, som kreftvev, hvor det er viktig å skille mellom forskjellige typer vannmolekylbevegelser. Kreftceller, som ofte har økt cellularitet, skaper et miljø hvor både de intrazellulære og ekstracellulære rommene blir påvirket, noe som gjør diffusjonen av vannmolekyler mer kompleks. Det er her RSI skiller seg ut: ved å bruke flere b-verdier og flere diffusionsretninger, kan RSI lage separate kart som gir en dypere innsikt i diffusjonsegenskapene til et gitt vev.

RSI-modellen bruker en matematisk tilnærming der flere eksponentielle komponenter beskriver diffusjonens ulike faser i forskjellige typer vev. For eksempel vil en RSI-modell for brystkreft skille mellom fettvev, fibroglandulært vev og kreftvev. Kreftvev, med høyere nuklear-til-cytoplasma-forhold og tettere celleopphopning, viser et karakteristisk mønster med høyere signal i det begrensede diffusjonsområdet (C1) og et moderat signal i det hindrede diffusjonsområdet (C2). Dette kan være et nyttig verktøy for å differensiere mellom kreftvev og sunt brystvev, der normalt fettvev viser høyere signal i det frie/hindrede diffusjonsområdet (C3). Slike detaljerte kart gir en visuell representasjon av kreftens diffusjonsegenskaper, samtidig som de gir kvantitative mål som kan benyttes i klinisk diagnostikk og overvåking.

RSI gir bedre visualisering av tumorer og kan skille mellom forskjellige typer diffusjon, som representerer ulike cellemiljøer. Dette gir klinikere muligheten til å skille mellom områder med høy cellularitet (begrensert diffusjon) og områder med lav cellularitet, som kan indikere ødem eller nekrose. Dermed tilbyr RSI et mer presist verktøy enn tradisjonelle metoder som standard diffusjonsvektet imaging (DWI) eller dynamisk kontrastforsterket MR (DCE-MRI), særlig i sammenheng med brystkreft, gynekologiske kreftformer, og overvåkning av behandlingseffekt.

Brystkreft og RSI

Brystkreft er den vanligste kreftformen blant kvinner, og en tidlig og nøyaktig diagnose er avgjørende for effektiv behandling. Tradisjonelle MR-metoder, som DCE-MRI, brukes ofte i screening av høyrisiko pasienter og for å vurdere tumorens respons på behandling. RSI viser seg å være et nyttig tillegg til disse teknikkene ved å tilby en mer presis visualisering av tumorer. Ved å benytte en brystspesifikk RSI-modell, kan man skille mellom forskjellige typer vev: fett, fibroglandulært vev, og kreftvev. For eksempel viser fibroglandulært vev et høyere signal i det hindrede diffusjonsområdet, mens kreftvev kan vise et høyere signal i det begrensede diffusjonsområdet. Denne distinksjonen er spesielt nyttig for å identifisere og differensiere svulster fra normalt vev.

Livmorhalskreft og RSI

Livmorhalskreft er en av de mest dødelige kreftformene blant kvinner. En av de største utfordringene ved behandling er å vurdere responsen på strålebehandling, da strålebehandling kan forårsake betydelig ødem i området som kan forsinke vurderingen av behandlingsresponsen. RSI-teknologien kan hjelpe til med å overvåke effekten av behandlingen på en mer presis måte, da den kan skille mellom kreftvev og ødem tidligere enn PET/CT-bilder. RSI-modellen for livmorhalskreft har blitt utviklet med et spesifikt fokus på å skille mellom kreftvev og friskt vev, og tidlige studier viser lovende resultater i å identifisere behandlingsrespons og tumorprogressjon.

Eggstokkreft og RSI

Eggstokkreft er en av de ledende årsakene til kreftrelaterte dødsfall blant kvinner. På grunn av utilstrekkelige metoder for tidlig påvisning, som ultralyd og CA-125 testing, er det et stort behov for bedre bildediagnostikk. RSI kan være et nyttig verktøy for tidlig deteksjon, spesielt hos pasienter med høy risiko, som de med BRCA 1 og 2 mutasjoner. Ved å bruke RSI for screening, kan man potensielt forsinke eller eliminere behovet for forebyggende kirurgi som salpingo-ooforektomi, som ellers kan føre til tidlig overgangsalder og tilhørende helseproblemer.

Viktige Overveielser

RSI-teknologien er fortsatt i utvikling og krever nøyaktige tilpasninger for ulike organer, noe som innebærer spesifikke modeller for hvert vev. Dette kan gjøre teknikken krevende å implementere i praksis, men dens potensiale til å gi mer presis informasjon om vevsstruktur og kreftforandringer er betydelig. Det er viktig å forstå at selv om RSI gir en kraftig forbedring i differensieringen mellom ulike typer vev, er det fortsatt et behov for videre forskning for å etablere definitive standarder og sikre dens brede kliniske anvendelse. Det er også viktig å merke seg at RSI ikke nødvendigvis vil erstatte eksisterende metoder som DCE-MRI eller PET/CT, men heller kan supplere disse for en mer detaljert og presis diagnose, behandlingsovervåkning og risikostratifisering.