Skäribot toi liikkumisen tiedon tekoälybotin kautta Kemiönsaaren ja Turunmaan saaristoon
NextLevel-hanke testasi keväästä syksyyn 2025, miten tekoälypohjainen keskusteleva chatbotti voisi helpottaa liikkumista ja palvelujen löytämistä saaristossa. Tavoitteena oli tuoda oikea tieto oikeaan aikaan sinne, missä sitä tarvitaan – sekä paikallisille asukkaisille että matkailijoille.
Teksti alla on tiivistelmä hankevetäjä Julius Uusikylän esitelmästä, joka löytyy artikkelin videosta. Uusikylä palkattiin hankkeeseen helmikuussa ai-asiantuntijaksi tutkimaan kuinka tietoa tarjoava tekoäly-bot voidaan kehittää.
Miksi tekoälybottia tarvittiin?
Saaristossa liikkuminen vaatii suunnittelua. Tieto lautoista, busseista, palveluista ja tapahtumista löytyy monesta eri paikasta: kuntien verkkosivuilta, matkailusivustoilta, kansallisista liikennepalveluista ja paperisilta aikatauluilta. Kaikki eivät tiedä, mistä etsiä – ja usein tieto pitäisi löytää juuri silloin, kun ollaan liikkeellä.
Ennen hanketta alueella oli jo kokeiltu kevyempiä tekoälybotteja, jotka lukivat verkkosivuja ja PDF-dokumentteja. Ne osasivat vinkata yksittäisiä tietoja ja linkittää matkailusivujen artikkeleihin. Mutta ne eivät osanneet antaa kattavia vastauksia, kuten kaikkia bussiyhteyksiä tiettyyn paikkaan tai kaikkia alueella olevia ravintoloita.
Next Level -hankkeen tavoite oli rakentaa pilotti, joka:
- antaa vain paikkansapitävää tietoa
- tarjoaa kaikki vastaukset, jotka liittyvät kysymykseen
- käyttää olemassa olevia tietolähteitä ja rajapintoja.
Tavoite oli tehdä testiluontoinen pilotti kesän 2025 aikana.
Miten tekoälybotti rakennettiin?
Kehitystiimissä työskenteli kaksi henkilöä: hankkeen vastuuhenkilö ja TUFF-hankkeen (saariston matkailun kehittämishanke) hankevetäjä. Pääosa tekoälybotin kehitystyöstä tehtiin helmikuusta joulukuuhun 2025.
Tekniseksi alustaksi valittiin Google Cloud Platform sen Conversational Agents -palvelun vuoksi. Se oli kevyempi rakentaa kuin muut vaihtoehdot vuoden 2024 lopun tietojen perusteella.
Botille annettiin nimeksi SkäriBot, ja sille luotiin oma verkkosivusto osoitteessa skarilog.fi. Sivusto suunniteltiin alun perin ylläpitämään kuuden satamanäytön sisältöjä, mutta se optimoitiin myös mobiililaitteille tekälychatin käyttöä varten.
Satamanäytöt ovat interaktiivisia näyttöjä, jotka sijaitsevat Kemiönsaaren ja Paraisten suurimmissa satamissa. Niiden kautta voi käyttää bottia sekä saada tietoa lauttaliikenteestä, aikatauluista, tapahtumista ja palveluista.
Mikä toimii, mikä ei? Strukturoidun ja strukturoimattoman tiedon ero
Hankkeen aikana opittiin tärkeä asia: kaiken tiedon laatu ei ole samanlaista tekoälyvastausten näkökulmasta.
Strukturoimaton tieto – joustavaa mutta epätarkkaa
Botille annettiin lähteinä:
- kuntien verkkosivut
- Visit-sivustot
- PDF-esitteet ja aikataulut
Näiden pohjalta botti osasi antaa tietoa, mutta vastaukset eivät olleet täydellisiä eivätkä aina oikeita. Vastaus saattoi myös vaihdella paljon kerrasta toiseen. Tämä johtuu siitä, että kielimalli toimii todennäköisyyksien pohjalta.
Skäribot käyttää RAG-periaatetta (Retrieval Augmented Generation) eli tekoäly generoi vastauksen hakutuloksen pohjalta. Kun tieto on epäjäsenneltyä tekstiä, kielimalli yrittää tulkita sen parhaansa mukaan – mutta ei aina onnistu.
Strukturoitu tieto – tarkkaa ja luotettavaa
Hankkeen aikana ehdittiin toteuttaa kaksi strukturoitua tietolähdettä:
1. Bussiaikataulut
- Tieto haettiin kansallisista rajapinnoista (GTFS-tiedostot FinAP-kannasta)
- Yhdistettiin DigiTransit API:n tietoon
- Tallennettiin Google BigQueryn tietokantaan, josta botti tekee tarkkoja hakuja
2. Tapahtumakalenteri
- Luotiin suora yhteys kuntien hankkimaan tapahtumakalenteriin
- API tarjosi kaiken tiedon käyttöön strukturoidussa muodossa
Hieman yksinkertaistaen, näitä lähteitä käyttämällä botin vastaukset olivat tyhjentäviä ja luotettavia. Vastausten sisältö pysyi paljon useammin samana, kun saman kysymyksen esitti botille uudelleen.
Miksi strukturointi on tärkeää?
Kielimallit osaavat erinomaisen hyvin tulkita käyttähän kysymysten asettelusta, mitä käyttäjä hakee. Mutta tiedon tuottaminen ei ole niiden vahvin alue – ainakaan silloin, kun vaaditaan täydellistä tarkkuutta.
Tämä työ on keskeistä, jos halutaan kilpailla yleisten kielimalli-palveluiden (kuten ChatGPT tai Gemini) kanssa. Ne osaavat vastata moneen kysymykseen, mutta eivät pysty aina takaamaan, että tieto on ajan tasalla tai täydellistä, vaikka niidenkin palveluihin tänä päivänä on kytketty laajasti hakutoimintoja.
SkäriBot-hankkeessa ei koulutettu omaa kielimallia – siihen ei ollut resursseja. Sen sijaan opetettiin botti tekemään tarkkoja tietokantahakuja. Tieto jäsenneltiin strukturoituun muotoon, jossa kerrottiin tarkasti, mitä dataa on missäkin esimerkiksi taulukon sarakkeessa tai rajapinnan osiossa.
Tämä on tavallaan askel takaisin ajatuksesta, että “kielimallille syötetään kaikki mahdollinen tieto ja katsotaan, voiko se vastata oikein tai löytää yhteyksiä, joita emme itse nähneet”. Sen sijaan lähestytään asiaa käytännöllisesti: annetaan botille työkalu hakea tarkka tieto oikeasta paikasta.
Mitä pilotista opittiin?
Käyttö ja kiinnostus
Kesän 2025 aikana ihmiset käyttivät bottia 5–10 kertaa päivässä kuudella satamanäytöllä. Suosituin aihe oli saariston lauttaliikenteen aikataulut ja muut liikkumiseen liittyvät kysymykset.
Data-analytiikan merkitys
Hanke osoitti, että tekoälybotin rakentaminen vaatii paljon data-analyytikkotyötä:
- Yhteydet kansallisiin rajapintoihin
- Tietokantatyöskentely
- Datan mallinnus
- Yhteys paikallistietoon
- Visualisoinnit
Tällaista työtä voisi jatkossa tehdä esimerkiksi alueen tasolla palvelemaan useiden kuntien tarpeita. Pohjatyö on nyt tehty, ja sitä voisi käyttää myös muilla alueilla, kun data löytyy kansallisista ja muista rajapinnoista.
Samalla työtä pitää tehdä vahvasti palvelumuotoilun kautta: millaisia kysymyksiä voi olettaa tulevan, mihin pystymme luotettavasti vastaamaan, mitä ongelmia haluamme ratkaista – sekä kuinka nämä muotoillaan järkeviksi vastauksiksi botille annettavien ohjeiden ja esimerkkien muodossa.
Datan ajantasaisuuden haaste
Vaikka tekniset ratkaisut ovat kunnossa, tiedon ajantasaisuus on kriittinen kysymys. Esimerkiksi ravintolat eivät mielellään päivitä aukioloaikojaan tietokantoihin, koska pelkäävät unohtavansa ne sinne – jos kesällä laitettu tieto on vielä lokakuussa näkyvissä vääränä, se aiheuttaa ongelmia asiakkaille.
Vastauksia on myös rajattava tietyissä asioissa. Vaikka ihmiset kysyivät paljon esimerkiksi onko vierassatamassa tilaa tai mihin aikaan Alko on auki, näihin ei voida antaa luotettavia vastauksia ilman reaaliaikaista dataa. Sen sijaan botti voi ohjata soittamaan satamaan tai tarkistamaan aukioloajat yrityksen Facebook-sivuilta.
Tieto ei saa jäädä botin sisään
Vaikka tekoäly on hyvä lisä, vastauksia ei tulisi “piilottaa” vain tekoälyvastausten sisään. Alueella suunnitellaan visualisointien luomista esimerkiksi kerätystä liikennetiedosta, jotta ne löytyvät myös kuntien omista kanavista. Näin ei tarvitse linkittää ulkoisiin palveluihin kuten Matka.fi.
Strateginen dokumentointi kannattaa
Hankkeessa kirjattiin tarkkaan:
- Mitä tietolähteitä käytettiin
- Mitä jätettiin pois ja miksi
- Mikä oli kunkin lähteen tarve ja käyttötarkoitus
Tämä strateginen ajattelu ja dokumentointi auttavat jatkokehityksessä ja siirrettäessä mallia muille alueille.
Työ tukee tiedolla johtamista
Hanke antoi yleiskuvan siitä, mistä eri aiheiden tietoa on saatavilla alueella. Tätä voi käyttää myös sisäisessä työssä tai muissa palveluissa – ei vain tekoälychatissa. Kun dataa on kerätty ja jäsennelty, sitä voidaan hyödyntää päätöksenteossa, viestinnässä ja yleiskuvan luomisessa sekä kunnan sisäisesti että ulkoisesti.
Mitä seuraavaksi?
Työn alla on:
- Yritysten ja palvelujen tietojen kerääminen eri lähteistä omaan tietovarastoon
- Suora yhteys LIPAS-tietokantaan, jossa on kuntien hallinoimia ulkoilu- ja liikuntapaikkoja
Matkailupalveluille on jo olemassa hyvä lähde: Visit Finland Data Hub, johon turismiyritykset voivat tuottaa tietoa omista palveluistaan ja tuotteistaan strukturoidussa muodossa. Tämä tieto näkyy jo nyt Kemiönsaaren ja Paraisten verkkosivuilla, mutta kun botti lukee sitä verkkosivuilta, tieto muuttuu taas strukturoimattomaksi. Siksi tarvitaan suora yhteys tietokannasta tekoälybottiin – vasta silloin botti pystyy tyhjentävästi listaamaan kaikki palvelut alueella.
Nämä tietolähteet ovat jo käytössä kuntien organisaatioissa muissa ratkaisuissa, joten on loogista liittää ne myös SkäriBOT-palveluun.
Haluatko kokeilla SkäriBOTia? Käy osoitteessa skarilog.fi tai testaa sitä Kemiönsaaren ja Paraisten satamien interaktiivisilla näytöillä.
P.S. Video on tehty ruotsinkielisen esitelmän pohjalta ja esityssivut ovat siinä ruotsiksi. Allekirjoittaneen ruotsinkielisessä päässä myös lopun “minä kiitän” on muuttunut muotoon “Kiitti mulle!”. Eli kiitos videon kuuntelijoille ja esitelmöitsijälle 🙂