Koneiden kuvitelmat

29.2.2024 klo 21.30, kirjoittaja
Kategoriat: Kosmokseen kirjoitettua , Kosmologia

Viime perjantaina Guilhem Lavaux tutkimuslaitoksesta Institut d’Astrophysique de Paris puhui Helsingin yliopiston fysiikan osaston astrofysiikan seminaarisarjassa koneoppimisesta kosmologiassa.

Koneoppiminen, joka tunnetaan myös nimellä AI (artificial intelligence eli tekoäly) on muotia, ja sitä halutaan käyttää kaikkialla, mukaan lukien paikoissa, joissa sen hyöty on kyseenalainen. On kuitenkin myös asioita, joihin koneoppimista tarvitaan.

Kosmologiset havainnot etenevät rivakasti. Parhaillaan havaintoja tekevän Euroopan avaruusjärjestö ESA:n satelliitin Euclid mittaukset kattavat maailmankaikkeuden osan, jonka tilavuus on 5 000 kuutiomiljardivalovuotta (vrt. kuutiokilometriä), eli yli 1030 kuutiovalovuotta, ja se havaitsee yli miljardi galaksia.

Datan määrä on kasvanut nopeammin kuin koneiden laskentateho, mikä vaikeuttaa havaintojen käsittelyä ja vertaamista teorioihin. Jossain vaiheessa havainnoissakin tulee raja vastaan: Euclid näkee jo noin 4% havaittavissa olevasta maailmankaikkeudesta. Paremmilla laitteilla jotka näkevät himmeämpiä kohteita voi vielä mitata tuhat kertaa enemmän galakseja kuin Euclid, mutta sitten ne on kaikki kartoitettu. Joka tapauksessa dataa tulee valtavasti, ja koneoppimisesta halutaan apua sen käsittelyyn.

Koneoppimisessa annetaan ohjelmalle joukko esimerkkejä, jotta se oppii tunnistamaan niistä oleellisia piirteitä, jaottelemaan niitä mielekkäästi ja tuottamaan uusia tapauksia itse. Esimerkiksi harjoitusaineistona voi olla kasa kuvia ja tieto siitä missä niistä on ihmiskasvot ja missä ei, jotta ohjelma oppii tunnistamaan kasvoja ja tekemään uusia kasvokuvia.

Koneoppimisen vahvuus on se, että ohjelmoijan ei tarvitse tietää mikä on oleellista, vaan ohjelma kehittyy itse hahmottamaan, mikä on tärkeää tunnistamisen ja toistamisen kannalta.

Lavaux kertoi, miten tätä käytetään kosmologisissa simulaatioissa. Perinteisissä simulaatioissa ohjelmalle annetaan aineen jakauma alussa sekä fysiikan lait, jotka määrittävät, miten aine vuorovaikuttaa. Sitten ohjelma laskee miten aine liikkuu. Koska kosmologiassa halutaan määrittää tunnettuja asioita tarkemmin sekä etsiä poikkeamia tunnetuista fysiikan laeista, on tärkeää simuloida useita eri vaihtoehtoja, jotta tiedetään mitä etsiä havainnoista.

Koneoppimisessa ohjelma koulutetaan joukolla simulaatioita, joista se oppii tunnistamaan miten rakenteet kehittyvät eri tapauksissa. Sitten ohjelmalle annetaan aineen jakauma alussa sekä yksinkertaistetun laskun tulos siitä, miten aine liikkuu. Ohjelma korjaa oppimansa perusteella tulosta parhaaksi katsomallaan tavalla.

Tämä on sata kertaa nopeampaa kuin simulaatioiden tarkka laskeminen. Lopputuloksen luotettavuutta on kuitenkin vaikea arvioida. Lavaux’n esittämien vertailujen perusteella koneoppimisen ja tarkkojen laskujen tulokset vastaavat tällä hetkellä toisiaan prosentin tarkkuudella niistä asioista, mitä on verrattu. Tätä voidaan varmasti parantaa.

Olen kuitenkin epäilevä. Mikään ei takaa, että koneoppiminen antaa oikean tuloksen myös sellaisille asioille, joita ei ole tarkistettu. Päinvastoin, on varmaa, että se ei anna kaikesta oikeaa tulosta. Oppiva ohjelma on nopea, koska se sivuuttaa paljon epäoleellisiksi katsomiaan piirteitä. Mutta kosmologiassa ei ole etukäteen täysin selvää, mikä on oleellista ja mikä ei.

Koneoppimisen vahvuus on myös sen ongelma: kun ei tiedä mitä ohjelma pitää oleellisena, on vaikea sanoa mitkä piirteet se sivuuttaa epäoleellisina. Kosmologian tapauksessa oppiva ohjelma käytännössä yksinkertaistaa fysiikan lakeja, jotka määrittävät sen, miten aine liikkuu. Koska havaintojen tarkoituksena on löytää pieniä ja uusia poikkeamia tunnetuista fysiikan laeista, mutta emme tiedä millaisista poikkeamista on kyse, on vaikea sanoa, sivuuttaako ohjelma oleellisia seikkoja.

Jos ohjelma löytää datasta uuden piirteen jota ei oikeasti ole olemassa, se on helppo tarkistaa ja hylätä. Mutta jos se hukuttaa signaalin kuvitelmaansa siitä, mitä tuloksen pitäisi näyttää, niin puutetta on vaikeampi korjata.

Sudenkuoppa syvenee, kun koneoppimista käytetään datan analysoimiseen. Data ja teoria eivät koskaan ole täysin erillisiä. Datan siivoamisessa ja analysoimisessa käytetään aina teoriaan perustuvia odotuksia siitä, miltä datan pitäisi näyttää, ja datan ja teorian arviointi kulkevat käsi kädessä. Jos teoriaa korvataan koneoppimisella, ennusteiden lisäksi myös datasta saattaa hukkua joitakin piirteitä.

Lavaux puhui myös koneoppimisen käyttämisestä toisenlaiseen tehtävään: auttamaan teorian ja havaintojen yhteyden löytämisessä korvaamatta teoriaa.

Tämä on ongelma, jonka ratkaisemiseen koneoppiminen soveltuu hyvin. Teoriassa on tyypillisesti useita erilaisia lukuja, jotka halutaan selvittää datasta. Ne kuvaavat esimerkiksi tavallisen aineen, pimeän aineen ja pimeän energian määriä ja alkujakaumaa.

Koska havaintojen yksityiskohdat riippuvat näistä luvuista monimutkaisella tavalla, voi olla vaikea löytää ne luvut, jotka kuvaavat havaintoja parhaalla tavalla. Koneoppiminen voi nopeuttaa oikeiden lukujen löytämistä huomattavasti, ja tuloksen voi tarkistaa.

Kuten muillakin aloilla, myös kosmologiassa koneoppimisen käyttö kasvaa nopeasti: viimeisimmässä konferenssissa aiheesta oli 400 osallistujaa, mikä on kosmologiassa paljon. Kun Lavauxilta kysyttiin, missä alan ongelmissa koneoppiminen hänen mielestään auttaa kymmenen vuoden aikana eniten, hän vastasi että on vaikea sanoa, kun siinä tapahtuu iso murros kuuden kuukauden välein tai useammin.

4 kommenttia “Koneiden kuvitelmat”

  1. Cargo sanoo:

    ”Lavaux puhui myös koneoppimisen käyttämisestä toisenlaiseen tehtävään: auttamaan teorian ja havaintojen yhteyden löytämisessä korvaamatta teoriaa.”

    Eikö koneoppimista voisi myös soveltaa teorian periaatteellisuuden tarkastamiseen; eli jos teoriaa ei sovittamallakaan saa vastaamaan havaintoja, niin se joutaa roskakoriin. Tuollainen sovittaminen voisi tapahtua vaikkapa lisäämäällä erilaisia polynomitermejä sekä vapaita parametreja.

    1. Syksy Räsänen sanoo:

      Teorioiden ja havaintojen vertailun yhtenä tarkoituksena on tietysti selvittää, mikä on paras teoria kuvaamaan havaintoja. Tällöin verrataan ei vain sitä, miten hyvin teoria sopii havaintoihin, vaan myös sitä, miten ennustusvoimainen se on. Tästä voisi joskus kirjoittaa oman merkintänsä.

  2. robert ekman sanoo:

    hei.

    nöyräpyyntö: kirjoittaisitteko joskus m-teoriasta! tästä aiheesta löytyy mielestäni kovin huonosti kansantajuista infoa.

    1. Syksy Räsänen sanoo:

      Olen kirjoittanut säieteoriasta (johon M-teoria liittyy) hieman täällä: https://www.ursa.fi/blogi/kosmokseen-kirjoitettua/kaikki-tai-ei-mitaan/

      Myös nämä merkinnät sivuavat aihetta:

      https://www.ursa.fi/blogi/kosmokseen-kirjoitettua/aika-avaruuden-atomit/

      https://www.ursa.fi/blogi/kosmokseen-kirjoitettua/miksi-kaiken-teorialla-on-merkitysta/

      Itse pidin näistä populaareista kirjoista aiheesta:

      Lawrence Krauss: Hiding in the Mirror: The Quest for Alternate Realities, from Plato to String Theory (by way of Alice in Wonderland, Einstein, and The Twilight Zone) (Penguin 2006)
      Lee Smolin: The Trouble With Physics: The Rise of String Theory, The Fall of a Science, and What Comes Next (Mariner Books 2007)
      Peter Woit: Not Even Wrong: The Failure of String Theory and the Search for Unity in Physical Law (Basic Books 2007)

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *