Tekoäly allsky-kuvien luokittelussa

Teksti: Antti Heikinmäki, Kuvat: Jyväskylän Sirius ry

Osallistuin keväällä 2023 Jyväskylän ammattikorkeakoulun järjestämälle kurssille, joka oli osa data-analytiikka ja tekoäly -opintokokonaisuuteen kuuluvia opintoja. Kurssilla oli tarkoitus toteuttaasyväoppimiseen liittyvä harjoitustyö ja pohdin voisiko tekoälyä hyödyntää revontulikuvien luokitteluun. Kurssin edetessä tutustuin Kristina Olsenin pro graduun ”Classification of Aurora Borealis Using Svalbard All-Sky Imager Data and EfficientNet Convolutional Neural Network”. Asiaa oli siis jo tutkittu, joten rohkaistuin tekemään oman kokeiluni aiheesta osana harjoitustyötä.

Terminologiaa

Tuntuu siltä, että tekoälyä on nykyään kaikkialla, eikä tunne täysin väärä olekaan. Sitä hyödynnetään jo laajasti ja itse termi “tekoäly” kattaa melkoisen joukon ilmiöitä ja asioita aina ChatGPT:n kaltaisista generatiivisen tekoälyn sovelluksista rekisterikilpien tunnistamiseen. Tähdet ja Avaruus -lehtikin uutisoi verkkojutussa 16.10.2023 tekoälyn “hoitaneen koko supernovan havaitsemisprosessin”. Yksi tekoälyn hyödyntämisen kohteista on kuvien luokittelu, jossa koneen tehtävä on esimerkiksi tunnistaa, että näkyykö kuvassa kissa vai koira. Kuvien luokittelu perustuu syväoppimisen menetelmiin kuten konvoluutioneuroverkkoihin. Tällaisen kuvia luokittelevan tekoälymallin luominen onnistuu kotikonsteinkin. Käytännössä tarvitaan mieluiten hyvällä näytönohjaimella varustettu tietokone, muutamia rivejä python-koodia, jokunen koodikirjasto, runsaasti aikaa ja tietenkin tekoälyn ruokaa eli dataa.

Aineistosta

Tarvittavan datan oman tekoälymallin luomiseen sain Harri Kiiskisen avustuksella Nyrölän observatoriolta. Sekä Nyrölän että Hankasalmen observatorioiden automatisoidut allsky-kamerat tuottavat väsymättä dataa kuvatiedostojen muodossa, joita kuka tahansa voi käydä ihastelemassa observatorioiden kotisivuilta tai kuvista tehtyjä koosteita Youtubesta. Mallin rakentamista varten valikoin Nyrölän aineistosta kuvia 11 päivältä yhteensä n. 12 GB verran, jotka luokittelin käsin kuuteen eri kategoriaan (revontulet, lunta kameran päällä, pilvistä, virhe, kuutamo, selkeää).

Näin se tehdään

Mallia rakennettaessa tavoitteena on siis tehdä luokittelija, jolle voidaan antaa kuva, ja se kertoo mihinluokkaan kuva kuuluu. Mallin luomisprosessi on kohtuullisen suoraviivainen. Ensin tarvitaan dataa, jolla luokittelija koulutetaan. Sitten malli koulutetaan, jonka jälkeen mallin toimivuutta analysoidaan ja jos se havaitaan toimivaksi, otetaan se käyttöön. Selkeitä oppaita mallien toteuttamiseen löytyy kohtuullisen hyvin. Itse käytin pohjana Googlen kehittämän Tensorflown kuvien luokittelun opasta, joka löytyy osoitteesta: https://www.tensorflow.org/tutorials/images/classification.

Kokeilun tulokset

“Sirius ASI Classifieriksi” nimeämäni kokeilu onnistui kohtuullisesti. Malli pystyy luokittelemaan kuvia oikeaan luokkaan yli 90% todennäköisyydellä. Sitä voidaan käyttää esimerkiksi luokittelemaan viimeisimmän Nyrölän observatorion ottaman ja verkkosivustolle julkaistun allsky-kuvan (kts kuva). Mallia voisi tosin parantaa monella eri tavalla kuten data-aineistoa lisäämällä. Alustavasti näyttäisi siltä,että esim. Hankasalmen dataa analysoitaessa tulokset ovat heikkoja. Joka tapauksessa kokeilu osoitti, ettäcproof-of-concept -tason toteutus toimii käytännössä.

Lopuksi

Havaintojen teko automatisoituu kovaa vauhtia, ja niinpä tarpeet automatisoituun analysointiinkin kasvavat. Siihen tekoälymallit ovat erinomainen apu. Muita käyttökohteita tekoäly-luokittelijoille on useita. Sen avulla voitaisiin isoista kuva-aineistoista koostaa vain revontulikuvia sisältäviä data-aineistoja (“dataset”) tutkimusta varten. Kaukana eivät ole myöskään toteutukset automaattisistarevontulihälytyksistä tai automaattisesti laadittavasta kelikalenterista. Lisäksi Kristina Olsenin varsinainen käyttötarkoitus eli revontulikuvien luokittelu revontulityyppien mukaan jäi itseltäni vielä kokeilematta, ja taisihan taannoin tähtiharrastusillassa olla pohdintaa halo-kuvien luokittelusta. Tähtitieteelliset havainnot ovat erinomainen kohde tekoälyn hyödyntämiselle, joten en yllättyisi jos tekoälysovellukset yleistyisivät  lähitulevaisuudessa myös tähtiharrastamisen parissa.

Juttu julkaistu alun perin Valkoinen Kääpiö -lehdessä 1/2024