Lääkkeiden kehityksen kustannukset, inflaatiokorjattuina, ovat kaksinkertaistuneet noin yhdeksän vuoden välein, mikä tunnetaan nimellä Eroomin laki. Tämä ilmiö heijastaa kasvavia haasteita ja heikkeneviä tuottoja lääkekehityksessä. Syitä tähän ovat muun muassa sääntelyviranomaisten varovaisuus, joka nostaa hyväksynnän kynnystä, sekä paine osoittaa uusia lääkkeitä olevan merkittävästi parempia kuin nykyiset, menestykselliset lääkkeet. Tämä "parempi kuin Beatles" -ongelma tekee uuden lääkkeen kehittämisestä entistä vaikeampaa ja kalliimpaa.

Kemiallisen lääkekomponenttien tilan valtava monimuotoisuus ei kuitenkaan tarkoita, että luotettavia rakenneaihioita olisi haitaksi. Erityisesti niin sanotut "privilege"-rakenteet ovat keskeisiä lääkemolekyylien joukossa. Ne kykenevät sitoutumaan useisiin eri proteiinitavoitteisiin, mikä tekee niistä arvokkaita lähtökohtia lääkekehitykselle. Esimerkkinä toimii bentsodiatsepiinirunko, joka esiintyy yleisissä lääkkeissä kuten diatsepaamissa ja alpraatsolamissa. Tämä rakenne vaikuttaa pääasiassa GABA-reseptoreihin, jotka ovat aivojen keskeisiä hermosolujen toimintaa hillitseviä kohteita, mutta bentsodiatsepiineilla on osoitettu olevan vaikutuksia myös esimerkiksi ruoansulatukseen liittyviin CCK-reseptoreihin ja HIV-1-viruksen entsyymeihin. Tästä monipuolisuudesta seuraa myös ongelma: tällaiset rakenteet voivat aiheuttaa sivuvaikutuksia sitoutumalla ei-toivottuihin kohteisiin ja ne ovat vaikeampia patentoida, koska niiden ympärillä on jo paljon olemassa olevaa tutkimusta ja patentteja.

Uudet, aiemmin tuntemattomat lääkeaineet ovat harvinaisempia ja niiden FDA-hyväksyntä on usein haastavampaa, mutta ne ovat arvokkaita sekä potilaiden hoidon että lääkeyritysten näkökulmasta. Uudet yhdisteet voivat kohdistua hoitamattomiin sairauksiin ja tarjota yrityksille kilpailuetua patenttisuojan ansiosta. Tekoälyn kehittyminen helpottaa lupaavien yhdisteiden esivalintaa ja optimointia, vähentäen näin FDA-hyväksynnän epävarmuutta ja riskejä.

FDA eli Yhdysvaltain elintarvike- ja lääkevirasto toimii lääkkeiden sääntelyssä tärkeänä portinvartijana varmistaen, että markkinoille pääsevät lääkkeet ovat turvallisia ja tehokkaita. Ilman FDA:n hyväksyntää lääkkeen myynti Yhdysvalloissa on laitonta. Muiden maiden markkinoilla on omat vastaavat viranomaisensa, joiden vaatimuksia tulee tarkastella.

Antibioottien kehitys on hyvä esimerkki lääkekehityksen haasteista. Penicilliinin keksiminen 1928 merkitsi valtavaa edistysaskelta, mutta uusien antibioottien löytäminen on 1990-luvulta lähtien hidastunut merkittävästi, vaikka resistenssin lisääntyminen tekee uusista antibiooteista yhä tärkeämpiä. Syväoppimiseen perustuvat tekoälymenetelmät ovat osoittautuneet tehokkaiksi uusien antibioottien löytämisessä, esimerkiksi olemassa olevan yhdisteen Halicinin uudelleenkäytössä. Näissä menetelmissä kone oppii itse löytämään lääkkeen ominaisuuksille relevantteja piirteitä, toisin kuin perinteisissä menetelmissä, joissa kemialliset ominaisuudet on määritelty ihmisen toimesta etukäteen.

Perinteisessä virtuaaliskannauksessa ja de novo -lääkekehityksessä on omat etunsa. Riippuen siitä, tunnetaanko molekyylin tai sen kohteen rakenne, valitaan sopiva menetelmä. Rakenteeseen perustuvassa suunnittelussa käytetään molekyylidokkauksia ja simulaatioita, kun taas ligandipohjaiset menetelmät perustuvat tunnetun molekyylin ominaisuuksiin. De novo -suunnittelussa luodaan kokonaan uusia molekyylejä kohteen rakenteen perusteella, mikä mahdollistaa innovatiivisten yhdisteiden löytämisen.

De novo -lääkekehityksen haasteena on usein uusien yhdisteiden synteesireittien löytäminen. Synteettinen kemia pyrkii yhdistämään lähtöaineita halutuksi tuotteeksi, mutta rajoitettu lähtöaineiden valikoima kaventaa mahdollisia reittejä. Retrosynteesi puolestaan toimii päinvastaiseen suuntaan, purkamalla tavoitemolekyyli yksinkertaisemmiksi lähtöaineiksi. Tämä lähestymistapa voi paljastaa tehokkaampia synteesireittejä, mutta on samalla haasteellisempi valtavan mahdollisten reittien määrän vuoksi.

On tärkeää ymmärtää, että lääkekehityksen monimutkaisuus ei johdu pelkästään kemian haasteista, vaan myös tiukoista sääntelyvaatimuksista ja markkinoiden kilpailutilanteesta. Tekoäly ja koneoppiminen tuovat uusia mahdollisuuksia nopeuttaa ja tehostaa tätä prosessia, mutta niiden hyödyntäminen vaatii syvällistä ymmärrystä kemiallisista ja biologisista periaatteista sekä sääntely-ympäristöstä. Lisäksi lääkeaineiden monimuotoisuus ja niiden vuorovaikutukset elimistössä ovat niin laajoja, että täydellinen hallinta on edelleen kaukana. Lääkekehityksen onnistuminen edellyttääkin yhdistelmää innovatiivista teknologiaa, perinteistä kemiaa, ja tarkkaa sääntelytietoutta.

Miten syväoppiminen mullistaa retrosynteesin ja proteiinirakenteiden ennustamisen?

Kun kemistit etsivät retrosynteesipolkuja eli menetelmiä uusien molekyylien synteesille, heitä haastaa valtava mahdollisten muunnosten määrä, joka kasvaa eksponentiaalisesti. Manuaalisesti tämä etsintä perustuu pitkälti heuristiikkoihin ja kokemukseen, mikä tekee prosessista aikaa vievän ja epävarman, erityisesti tuntemattomien kemikaalien kohdalla, joiden alirakenteita ei ole aiemmin tutkittu. Tässä kohtaa syväoppiminen tarjoaa uudenlaisen mahdollisuuden — se kykenee tehokkaasti kartoittamaan valtavan kemiallisen tilan ja ehdottamaan lupaavia, ennennäkemättömiä synteesejä. Tämä avaa ovia sekä uusien lääkkeiden kehitykseen että olemassa olevien lääkkeiden kustannustehokkaampaan ja nopeampaan valmistukseen.

Retrosynteesin soveltaminen linkittyy läheisesti prosessikemiaan, jossa tavoitteena on löytää kaupallisesti kannattava, turvallinen ja taloudellinen tapa tuottaa lääkettä. Tässä kokonaisuudessa syväoppiminen ei ainoastaan nopeuta synteesien suunnittelua, vaan tuo myös esiin uusia, aiemmin huomiotta jääneitä mahdollisuuksia.

Toinen merkittävä alue, johon syväoppiminen on tuonut läpimurron, on proteiinien kolmiulotteisten rakenteiden ennustaminen. DeepMindin kehittämä AlphaFold2 on saavuttanut huipputason tarkkuuden ennustettaessa proteiinien rakennetta aminohapposekvenssin perusteella. Proteiinit koostuvat aminohapoista, joiden järjestys ja sivuketjujen vuorovaikutukset ohjaavat proteiinin lopullista kolmiulotteista muotoa — rakenne, joka määrää proteiinin toiminnan.

Proteiinien rakenteen tunteminen on olennaista niiden toimintamekanismien ymmärtämiseksi ja poikkeavuuksien havaitsemiseksi, jotka voivat aiheuttaa sairauksia. Perinteisesti proteiinien rakenteen määrittäminen on ollut kallista ja hidasta, mutta syväoppimismallit ovat mahdollistaneet rakenteiden nopean ja tarkemman ennustamisen. Tämä yhdistää kokeelliset ja laskennalliset menetelmät, tehostaen lääketutkimusta.

Peptidit, lyhyemmät aminohappoketjut, jotka eivät muodosta monimutkaisia rakenteita kuten proteiinit, hyötyvät myös syväoppimisen sovelluksista. Niiden kemiallinen synteesi on yksinkertaisempaa ja halvempaa, mikä tarjoaa käytännöllisiä etuja lääkkeiden valmistuksessa.

Syväoppimisen tuomat edistysaskeleet avaavat mahdollisuuksia suunnitella molekyylejä, ennustaa niiden ominaisuuksia ja optimoida lääkeainekandidaatteja. Tämä kaikki tapahtuu entistä nopeammin, taloudellisemmin ja tarkemmin, mikä on ratkaisevaa lääkekehityksen kiihtyvässä maailmassa.

Ymmärtääksemme paremmin, miten nämä työkalut toimivat, on tärkeää erottaa käsitteet tekoäly, koneoppiminen ja syväoppiminen. Koneoppiminen perustuu mallien rakentamiseen datasta, missä malli oppii tunnistamaan kaavoja ja yleistämään aiemmista esimerkeistä. Tämä mahdollistaa ennustamisen myös uusille, aiemmin näkemättömille molekyyleille, mikä on välttämätöntä jatkuvasti laajenevassa kemiallisessa avaruudessa.

Yksi merkittävä haaste on, että malli ei saa jäädä "muistamaan" vain harjoitusdataa, vaan sen tulee pystyä tunnistamaan yleisiä piirteitä ja soveltamaan oppimaansa laajemmalle aineistolle. Tämä yleistäminen on ratkaisevaa, sillä lääketutkimuksessa kohdataan jatkuvasti uusia, rakenteellisesti erilaisia molekyylejä.

Lisäksi on huomioitava, että koneoppimisen tehokkuus riippuu