I kampen mot virala sjukdomar som COVID-19 har snabb upptäckt och utveckling av antivirala läkemedel blivit en prioritet. SARS-CoV-2:s huvudproteas (Mpro) har visat sig vara en central målstruktur för att stoppa virusets replikation. En framstående strategi har varit att genomföra högkapacitets screening (HTS) för att utvärdera tusentals föreningar och deras förmåga att hämma Mpro, där läkemedel som Paxlovid och Ensitrelvir visat klinisk framgång. I detta sammanhang har användningen av avancerade datorbaserade metoder, särskilt inom maskininlärning och djupinlärning, visat sig vara avgörande för att snabbt identifiera potentiella läkemedelskandidater.

En del av det större projektet COVID Moonshot använde crowdsourcing för att samla över 18 000 läkemedelsdesigns, som sedan bedömdes med hjälp av syntetisk genomförbarhet och förväntad aktivitet. Från dessa designförslag syntetiserades över 2000 föreningar, och en rad HTS- och kristallografiexperiment genomfördes för att bestämma deras struktur och viability som potentiella läkemedel. Bland dessa föreningar mättes IC50, vilket är den koncentration som krävs för att hämma 50% av proteinaktiviteten. En förening med ett lågt IC50-värde är önskvärd eftersom det indikerar hög effektivitet vid låga koncentrationer, vilket minskar risken för oönskade interaktioner med andra proteiner.

Denna typ av tillvägagångssätt inom läkemedelsforskning skulle vara omöjlig att genomföra utan kraftfulla datormodeller som kan hantera och analysera de enorma mängder av biologisk och kemisk information som krävs för att utveckla nya läkemedel. I denna kontext har djupinlärning blivit ett oumbärligt verktyg. Djupinlärning, som en avancerad form av maskininlärning, gör det möjligt för modeller att lära sig komplexa mönster i stora datamängder och tillämpa denna kunskap för att förutsäga hur ligander interagerar med proteiner. Detta har öppnat nya möjligheter för att både förstå proteinstruktur och optimera liganddesign.

Protein- och ligandinteraktioner spelar en avgörande roll i läkemedelsutveckling, särskilt när det gäller att förstå hur proteiner fungerar och hur små molekyler (ligander) kan påverka deras aktivitet. En stor del av läkemedelsforskningen fokuserar på proteiner som kinaser, som är viktiga mål i utvecklingen av läkemedel mot cancer och inflammatoriska sjukdomar. Kinaser är enzymer som överför fosfatgrupper från ATP till andra proteiner, vilket kan aktivera eller inaktivera olika signalvägar i cellen. Det finns för närvarande cirka 80 godkända små molekylinhibitorer för protein kinaser, men många delar av kinasefamiljen är fortfarande underutforskade.

Ett av de största hindren för utveckling av effektiva kinasinhibitorer är deras affinitet och selektivitet. Eftersom kinaser delar många liknande strukturer, särskilt vid ATP-bindningsställen, är det ofta en utmaning att utveckla inhibitorer som endast binder till det önskade målet utan att påverka andra kinaser. Detta gör att inhibitorernas selektivitet är av största vikt, och det är här som datorbaserade metoder kan ge värdefulla insikter. Genom att använda virtual screening (VS) kan forskare förutsäga hur olika molekyler interagerar med specifika proteiner, vilket hjälper till att hitta de mest lovande kandidaterna.

Inom detta område har AI och djupinlärning särskilt gynnat forskningen på grund av den stora mängd data som finns tillgänglig för enzymer och proteiner. Förutom kinaser har andra proteinfamiljer också blivit populära mål för läkemedelsforskning, inklusive receptorer som G-proteinkopplade receptorer (GPCR) och ligandstyrda jonkanaler (LGIC). Dessa receptorer är inblandade i många biologiska processer, och deras komplexa struktur gör dem svåra att analysera och behandla med traditionella metoder.

GPCR:er och LGIC:er är membranproteiner som svarar på ligandbindning för att reglera cellfunktioner. Dessa proteiner spelar en viktig roll i kommunikation mellan celler, och många läkemedel, inklusive neurotransmittorer, verkar genom att binda till dessa receptorer. Eftersom dessa målproteiner är så komplexa och inblandade i ett brett spektrum av biologiska processer, är de ofta svåra att designa läkemedel för utan hjälp av avancerade beräkningsmetoder.

Vid användningen av djupinlärning för att modellera protein-ligandinteraktioner, sker förutsägelser ofta på grundval av stora mängder experimentell data, där modeller som tränas för att känna igen mönster och beteenden hos olika molekyler används. En sådan modell kan sedan hjälpa till att förutsäga effektiviteten och specifiteten hos potentiella läkemedel. PyTorch, en populär plattform för att bygga och träna neurala nätverk, är ett av de vanligaste verktygen som används för att implementera sådana modeller inom läkemedelsforskning.

Det är också viktigt att förstå att trots framstegen med AI och djupinlärning finns det fortfarande stora utmaningar. Modeller som förutspår interaktioner mellan proteiner och ligander är fortfarande under utveckling och kräver mycket noggranna tester och valideringar. Dessutom måste det beaktas att även om en förening är effektiv i ett experimentellt system, betyder det inte nödvändigtvis att den kommer att vara effektiv i ett kliniskt sammanhang. Djupinlärning och andra beräkningsmetoder kan dock bidra till att snabbare identifiera de mest lovande kandidaterna och därigenom påskynda hela läkemedelsutvecklingsprocessen.

Hur AI och Maskininlärning kan Förbättra Läkemedelsutveckling och Patientssäkerhet

I läkemedelsindustrin är det avgörande att förstå och systematiskt analysera läkemedelsstrukturer för att effektivt designa nya terapier. Ett av de mest centrala verktygen för att uppnå detta är maskininlärning, som erbjuder kraftfulla metoder för att analysera molekylära data och identifiera mönster som annars skulle vara svåra att upptäcka.

En grundläggande aspekt av läkemedelsnamngivning är användningen av USAN-stammar (United States Adopted Names), där specifika suffixer används för att klassificera läkemedel efter deras funktionella egenskaper. Till exempel indikerar suffixet “-caine” lokalanestetika, medan “-cillin” är kopplat till penicilliner, och “-vir” används för antivirala medel. Denna terminologi spelar en viktig roll för att snabbt kunna identifiera läkemedelsfunktion och göra skillnad mellan olika typer av läkemedel.

För att ytterligare förstå de strukturella och terapeutiska egenskaperna hos läkemedel kan man använda en metod som kallas PCA (Principal Component Analysis), en teknik för att minska datadimensioner. Denna metod gör det möjligt att reducera en 1024-dimensionell kemisk datamängd till ett fåtal huvudkomponenter (PC), vilket gör det lättare att analysera och visualisera läkemedelens kemiska utrymme. När man visualiserar läkemedel i ett reducerat utrymme, kan man se att läkemedel som tillhör samma funktionella klass (t.ex. "-caine", "-cillin", "-sulfa") ofta tenderar att grupperas nära varandra, vilket underlättar deras identifiering och jämförelse.

En annan viktig metod inom maskininlärning är övervakad inlärning, exempelvis logistisk regression, som kan användas för att klassificera läkemedel baserat på deras kemiska strukturer. Genom att träna en modell på molekylära data kan man bättre förstå de gränser som skiljer olika läkemedelsklasser åt och förutsäga vilket läkemedel som troligtvis tillhör en viss klass baserat på sina kemiska egenskaper.

För att skapa ännu mer precisa modeller, kan man kombinera PCA med maskininlärningstekniker för att definiera mer exakta beslutspunkter och bättre separera läkemedel i olika klasser. Modellen kan exempelvis lära sig att identifiera en molekyl som tillhör "-cillin"-klassen med högre säkerhet än en molekyl som tillhör "-olol"-klassen, beroende på deras kemiska egenskaper. Detta är ett viktigt steg i läkemedelsutveckling, där man kan förutspå läkemedlets effekt och användbarhet genom att analysera dess struktur innan kliniska försök.

I det längre perspektivet är det viktigt att förstå hela läkemedelsutvecklingsprocessen, där maskininlärning kan spela en central roll för att optimera olika faser. Läkemedelsdesign kan delas in i flera faser: målidentifiering, träffupptäckt (hit discovery), träff-till-led (hit-to-lead), ledoptimering och preklinisk utveckling. Det är i dessa faser som AI och maskininlärning har potentialen att maximera framgången genom att snabbt identifiera lovande molekyler och optimera deras egenskaper.

För att exempelvis identifiera ett lämpligt mål för ett läkemedel, måste man först förstå de bakomliggande mekanismerna för den sjukdom man vill behandla. Detta innebär att man identifierar biomolekyler som spelar en avgörande roll i sjukdomens utveckling och därefter fokuserar designen på en förening som kan binda till dessa mål och modulera deras aktivitet. Här kan maskininlärning användas för att analysera stora mängder biologiska och kemiska data, vilket ger forskarna bättre insikter i vilka mål som kan vara mest effektiva att rikta in sig på.

Det är också viktigt att notera att när läkemedel går vidare till kliniska prövningar, så genomgår de flera tester för att säkerställa deras säkerhet och effektivitet. Maskininlärning kan spela en avgörande roll även i detta skede genom att analysera resultat från prekliniska och kliniska data för att förutsäga biverkningar och andra risker innan läkemedlet når marknaden.

För att sammanfatta, är maskininlärning ett kraftfullt verktyg för att förbättra förståelsen av läkemedelsstrukturer och deras terapeutiska egenskaper. Genom att använda tekniker som PCA, logistisk regression och andra maskininlärningsmetoder, kan vi inte bara optimera läkemedelsdesign, utan också göra läkemedelsutveckling snabbare och säkrare. Men för att verkligen utnyttja dessa verktyg, måste forskare och ingenjörer förstå både de teoretiska och praktiska aspekterna av AI, samt de olika faserna av läkemedelsutveckling, från målidentifiering till kliniska prövningar.