Miten tekoäly oppii ja ymmärtää suuria tietomassoja?

Tekoälyjärjestelmillä on uskomattomia kykyjä tuottaa tuloksia, jotka muistuttavat ja tietyissä tapauksissa jopa peilaavat niitä aineistoja, joilla ne on koulutettu (esimerkiksi kuvia tai kirjoituksia). On siis yleistä kuvitella, että tekoälymallit tekevät jotain, joka muistuttaa tietokannan hakua, jota seuraa leikkuuprosessi, jonka avulla ne luovat omia tuotoksiaan. Vertailun vuoksi voisi kuvitella taideopiskelijan, joka omistaa pussin täynnä lehtileikkeitä ja joka luo uusia teoksia pyynnöstä. Tällainen ajatus ei kuitenkaan ole lainkaan se tapa, jolla tekoälymallit toimivat käytännössä.

Kun tekoälyjärjestelmää on koulutettu, koulutusdata ei ole enää sen käytettävissä. Kuvitellaanpa, että taideopiskelijan pussi ei ole enää käytettävissä koulutuksen jälkeen. Tekoälyjärjestelmä oppii koulutusdatan avulla tarkastelemalla kutakin dataesitystä ja päivittämällä itseään toistuvasti. Tämä muistuttaa osittain sitä, kuinka ihmiset oppivat: jotta lapsi oppisi erottamaan punaisen ja oranssin värin, hänen täytyy oppia esimerkkien avulla, jotka kattavat eri sävyjä punaisesta ja oranssista. Vaikka lapsi aluksi usein sekoittaisi värit, jokainen uusi esimerkki parantaa hänen kykyään erottaa ne toisistaan. Lapsen aivot päivittävät hänen käsityksensä "oranssista" ja "punaisesta" jatkuvasti, kunnes hän osaa lopulta tunnistaa värit täydellisesti, vaikka ne ilmenevät esimerkkisarjan ulkopuolella. Vähäisellä harjoituksella lapsi saattaa jopa sekoittaa maaleja tuottaakseen oranssin värin ilman mitään esimerkin viittausta. Kaikki tämä oppiminen tapahtuu lapsen aivoissa, joissa syvä ymmärrys väristä tallentuu biologisesti.

Tekoälymalleissa taas "oppiminen" tallentuu monimutkaisiksi numerosarjoiksi, jotka edustavat monisuuntaisia sijainteja suhteessa muihin monimutkaisiin numerosarjoihin. Kun tarkastelemme tekoälymallin toimintaa, esimerkiksi suuren kielimallin, kuten ChatGPT:n, kautta, voimme käyttää yksinkertaista analogiaa. Kuvitellaan, että haluamme oppia kaiken, mitä tiedämme Washington D.C.:stä. Kyseessä on monivivahteinen ja rikas kaupunki, jolla on Yhdysvaltojen pääkaupungin ainutlaatuinen asema, erilaisia kaupunginosia, historiallisia monumentteja, valtion virastoja ja poliittisen historian kerroksia. Tavoitteemme on luoda ymmärrys Washingtonista, joka huomioi sen moninaisuuden.

Ihmisen lähestymistapa voisi alkaa kaupungin eri alueiden tutkimisella, keskustelemalla paikallisten kanssa, lukemalla historiallisia tekstejä, tutustumalla maantieteellisiin karttoihin ja yleisesti pyrkimällä imeytymään kaupungin historian ja maiseman eri ilmiöihin. Samalla tavalla tekoälymallin ohjelmoija voisi etsiä internetistä karttoja, valokuvia, kongressin asiakirjoja, hallituksen dokumentteja, historiallisia arkistoja, uutisartikkeleita ja politiikkapapereita Washingtonista. Tämä ei kuitenkaan riitä, sillä mallin tulee ymmärtää myös kaupungin tunnelma, sen ruoat, kulttuuri ja subjektiivinen kokemus kaupungin vierailemisesta ja siellä asumisesta. Kuinka paljon tietoa meidän on kerättävä ja analysoitava, jotta saamme kattavan kuvan kaupungista?

Tietoa on valtavasti: kirjoja, artikkeleita, verkkosivustoja ja keskusteluja, joiden sisällöt ovat erittäin moninaisia. Yksi lähde voi tarjota postinjakelureittien kartan vuodelta 1876, toinen taas olla sosiaalisen median kautta saatu putkimiehen suositus. Nämä tekstit on kirjoitettu erilaisilla äänillä ja kirjoitustyyleillä, ja ne edustavat eri aikakausia ja näkökulmia. Tavoitteemme on luoda ymmärrys Washingtonista, joka kattaa sen monet ulottuvuudet, mutta kukaan projekti ei ole rajattomilla resursseilla varustettu. Ennen kuin edes aloitamme kaupungissa vaeltamisen, meidän on tehtävä tärkeitä suunnittelupäätöksiä siitä, kuinka rakennamme kartan ja mahdollisesti koordinoimme tiimin apua.

Ensimmäinen suunnittelupäätös liittyy siihen, kuinka jaamme kaiken tiedon pieniin, hallittaviin osiin, jotka auttavat meitä navigoimaan kaupungissa. Emme tee päätöksiä siitä, mitä kunkin tiedon palan tulisi sisältää, vaan kuinka monta osaa meillä tulee olemaan. Tämä päätös voi olla sidoksissa käytettävissä oleviin resursseihin. Esimerkiksi suurilla kielimalleilla suunnittelijat voivat jakaa tiedot yksittäisiin sanoihin, kahden sanan yhdistelmiin, tavuihin tai jopa yksittäisiin merkkeihin. Erilaiset palakoot soveltuvat eri tehtäviin, ja tämä alkuperäinen päätös määrittää pitkällä aikavälillä sen, kuinka monta ainutlaatuista sanaa tai ideaa tekoälymalli ymmärtää (sen sanasto).

Oletetaan, että päätämme, että kartallamme on 50 000 osaa tietoa. Kukin osa voi olla maamerkki, kuten Valkoinen talo, ominaisuus, kuten "rehellinen", yksityiskohta, kuten "vesi" tai käsite, kuten "hallitus". Nämä 50 000 osaa muodostavat kartan yksityiskohtia, joita paikannetaan koordinaattien avulla, jotta voimme ymmärtää niiden sijainnin suhteessa muihin tietoihin. Voimme kuvitella, että sijoitamme nämä osat kartalle, ja meidän odotetaan oppivan jokaisen osan sijainnista ajan myötä. Tämä ei kuitenkaan ole tavallinen kaksidimensionaalinen kartta, jossa koordinaatit olisivat suhteellisen yksinkertaisia. Meillä on mahdollisuus valita, kuinka monta ulottuvuutta kartallamme on. Oletetaan, että valitsemme 300 ulottuvuutta. Tämä voi kuulostaa paljon, mutta tarvitsemme niin monta ulottuvuutta ymmärtääksemme tietojemme välisiä suhteiden tasoja. Emme halua vain tietää, kuinka kaukana kaksi D.C.:n ruokapaikkaa ovat toisistaan, vaan haluamme myös tietää, kumpi niistä on paremmin arvosteltu ja kumpi perustettiin sisällissodan aikana.

Kun valitsemme 300 ulottuvuutta, jokaiselle karttanaulalle on määritettävä monimutkainen numerosarja, joka kertoo sen sijainnin kaikissa 300 ulottuvuudessa. Kun kartalla on 50 000 osaa, jotka kaikki vaativat koordinaatit 300 ulottuvuudessa, voimme kuvitella, kuinka vaikeaa olisi yksin löytää, missä kaikki sijaitsee suhteessa toisiinsa. Tässä vaiheessa tulemme toiseen päätökseen: kuinka monta opasta voimme palkata ja kuinka monta tutkimusmatkaa voimme lähettää heidät tekemään? On syytä huomata, että opas ei tarvitse erityistietämystä D.C.:stä tai opastamisesta. Me voimme palkata ketä tahansa, joka pystyy seuraamaan yksinkertaisia ohjeita, vaikka he eivät olisi koskaan käyneet D.C.:ssä eivätkä olisi matkailuoppaiden liiketoiminnassa.

Tekoälymallin rakennusprosessi vaatii tarkkaa suunnittelua ja jatkuvaa yhteistyötä monien osapuolten kesken, mutta se on välttämätöntä, jotta voidaan luoda järjestelmä, joka ymmärtää, ei vain faktat, vaan myös kontekstit ja vuorovaikutukset. Tämän prosessin avulla tekoälymalli voi "opetella" monimutkaisia ja usein erittäin hienovaraisia yhteyksiä eri tietokokonaisuuksien välillä.

Patenttien myöntämisen kynnys ja keksinnön ilmeisyys – miten määritellään keksinnön ainutlaatuisuus?

Patenttilainsäädännön keskeinen vaatimus on, ettei patenttia voida myöntää keksinnölle, jos se on ilmeinen alan tavanomaiselle osaajalle ennen keksinnön hakemuksen vireillepanoa. Tämä tarkoittaa, että keksinnön tulee sisältää riittävästi teknologista edistystä verrattuna aikaisempaan tekniikkaan, jotta sitä voidaan pitää keksinnöllisenä ja patentoitavana. Ilmeisyysperiaatteen tarkoituksena on estää niin sanottujen triviaalien tai tavanomaisten kehitysaskelten patentoiminen, jotka eivät todellisuudessa edistä teknologista innovaatiota.

Yhdysvaltain patenttilain 35 U.S.C. § 103 säätelee tätä vaatimusta ja korostaa, että vaikka keksintö ei olisi identtinen aiempaan tekniikkaan nähden, se ei ole patentoitavissa, jos alan tavanomainen osaaja kokee keksinnön kokonaisuutena katsottuna ilmeiseksi. Tämä "alan tavanomainen osaaja" eli PHOSITA (Person Having Ordinary Skill In The Art) on hypoteettinen henkilö, jolla oletetaan olevan normaali osaaminen ja tieto alan teknologioista, mutta ei erityistä luovuutta tai ennakoimattomia löytöjä. Korkein oikeus on korostanut, että markkinavoimat ja suunnittelun kannustimet voivat johtaa ennakoitavissa oleviin variaatioihin teknisissä ratkaisuissa, eikä näitä tule suojata patenteilla.

Ilmeisyyden arviointi vaatii laaja-alaista tutkimusta aikaisemmasta tekniikasta ja alan osaamisen tasosta. Tarkastelussa on ensisijaisesti erotettava keksintöä koskeva vaatimus aikaisemmasta tekniikasta ja tunnistettava, olisiko alan osaajan ollut luonnollista yhdistää tunnettuja elementtejä tai soveltaa olemassa olevaa tietoa. Tässä prosessissa korostuu sekä teknologian sisältö että osaajan odotettu tieto ja taitotaso. On tärkeää huomata, että ilmeisyyden arviointi ei edellytä absoluuttista varmuutta keksinnön onnistumisesta, vaan riittää kohtuullinen odotus menestyksestä.

Patenttioikeudessa käytetty PHOSITA-käsite toimii tehokkaana työkaluna erottamaan merkittävät teknologiset harppaukset ja ilmeiset ratkaisut. Se heijastaa myös oikeudellista tasapuolisuutta, koska se asettaa vaatimukset keksijöille suhteessa siihen, mitä alan keskimääräinen asiantuntija jo tietää tai pystyy päättämään. Tämä vähentää tilannetta, jossa patenttioikeus suojaisi vain pieniä, helppoja muutoksia ilman todellista innovatiivisuutta.

Patenttijärjestelmän tavoitteena on innovaation ja teknologisen kehityksen edistäminen. Ilmeisyysperiaate toimii suojamekanismina, joka estää liian laajojen patenttioikeuksien myöntämisen, jotka voisivat estää kilpailua ja teknistä edistystä. Tämä periaate suojaa tiedon vapaata leviämistä ja kannustaa keksijöitä kehittämään aidosti uusia ja merkittäviä teknologioita.

Lisäksi on tärkeää ymmärtää, että ilmeisyyden arvioinnissa otetaan huomioon paitsi tiedon määrä, myös sen laatu ja saatavu

Kuinka luoda ja optimoida mukautettuja GPU-kerneliä CuPyn avulla
Miten visualisointi tukee datan analyysia ja ymmärtämistä?
Kuinka käyttää mallinnusta terveysdataan XGBoostilla ja H2O:lla