Tekoälyn merkitys yritysten toiminnassa on alkanut ottaa jalansijaa. Tekoäly tarjoaa mahdollisuuksia tehostaa prosesseja ja saada tehtyä töitä, jotka ovat jääneet tekemättä liian vähäisten resurssien vuoksi. Omien kokemusteni myötä yritysten markkinointi- tai verkkokauppojen sisällöstä vastaavat ovat usein niitä joilla on paljon ideoita miten parantaa sisältöjä, mutta ei tarpeeksi resursseja saada työlistaa lyhennettyä.
Vaikka tekoälyn hyöty työn avustajana ollaan useissa yrityksissä ymmärretty, yksi suurimmista haasteista sen hyödyntämisessä päivittäisissä käytössä on vastausten laatu ja yritykselle tärkeän datan käyttäminen lähteenä. Laadun parantamista käsiteltiinkin jo aiemmassa blogissa, ja tässä blogissa pureudumme miten erityisesti markkinoinnin tai tuotetietojen kanssa työskentelevät saavat lisättyä yrityksen omaa dataa tekoälyn vastauksiin helposti ja skaalattavasti.
Investoi harkiten
Usein, kun keskustellaan oman datan käytöstä ja tekoälyn vastauksen rikastamisesta sen avulla, tarkoittaa tämä mittavia IT-investointeja. Aina tämänkaltaiset investoinnit eivät ole mahdollisia, joten tämän artikkelin tavoitteena on esitellä erityisesti käytännönläheisiä keinoja, joita voidaan ottaa matalalla kynnyksellä käyttöön. Keskitymme blogissa erityisesti digitaalisen markkinoinnin töihin ja markkinoinnissa käytettävään dataan.

Rikastetun datan merkitys tekoälyn suorituskyvylle
Mutta mitä datalla rikastus oikeastaan tarkoittaa? Yksinkertaistettuna se on kontekstuaalisen tiedon antamista tekoälyn käyttöön. Data on usein jalostettu niin, että se tarjoaa syvemmän ja monipuolisemman ymmärryksen käsiteltävästä aiheesta tai sisällyttää tietoa, jota ei löydy tekoälyn omasta tietovarannosta.
Rikastetulla datalla on merkittävä vaikutus tekoälyn vastauksiin. Se auttaa tekoälyä ymmärtämään paremmin kysymysten kontekstin, tarjoaa tarkempia ja relevantimpia tietoja sekä mahdollistaa monimutkaisempien päättelyketjujen muodostamisen. Käytännössä tämä näkyy täsmällisempinä, kattavampina ja hyödyllisempinä vastauksina.
Digitaalisessa markkinoinnissa tekoälylle annettava tieto voi olla esimerkiksi:
- Sivustokarttoja tai esimerkiksi tuotekategorioiden tietoja
- Avainsanatutkimuksia
- Tuote- tai tuotekategorioiden tietoja
- Kohderyhmien määrittelyiden dokumentteja
- Brand bookin mukaisia tekstin sävyn määrittelyitä
Rikastetun datan hyödyistä löytyy esimerkkejä useissa markkinoinnin tehtävissä:
- Verkkokaupoissa tuotekategorioiden tai tuotteiden tiedot, auttava tekoälyä kirjoittamaan relevantteja ja faktisia tekstejä kategorioihin tai tuotteisiin
- Avainsanatutkimuksilla tekoäly saa todellista hakudataa ja voi tuottaa SEO-optimoituja sisältöjä avainsanojen arvailunsijaan
- Sivustokartoilla saadaan lisättyä relevantteja sisäisiä linkityksiä automaattisesti
- Kohderyhmien määrittelyillä tekstin sisältö muuttuu persoonallisemmaksi vastaanottajalle
- Brand bookin hyödyntämisellä saadaan geneerisen tekstin sijasta kirjoitettua brändin äänensävyllä
Seuraavaksi käymme läpi muutamaa eri tapaa saada omaa dataa tekoälyn käyttöön. Keinot on listattu suurinpiirteisessä haastavuusjärjestyksessä, joista datan lisääminen promptiin tai tekoälybotin tiedostoihin ovat helppoja voittoja ja reaaliaikaisempi data vaatii usein myös IT-projektia. Olemme implementoineet datan rikastuksen ratkaisuita omaan OIKIO AI tekoälyalustaamme, joten jos haluat valmiimpaa ratkaisua voimme kertoa lisää mahdollisuuksista.
Esimerkki datalla rikastetusta vastauksesta
Vakiovastaus kategoriatekstissä
Tarjoamme ruohonleikkureita moneen eri käyttötarpeeseen ja meiltä löydät ratkaisun jolla saat pihan siistiksi.
Vastaus rikastetulla datalla, jossa on mukana mitä tuotteita ja brändejä verkkokauppa tarjoaa ja heidän oma arvolupauksensa
Tarjoamme polttomoottorikäyttöisiä ja sähköisiä ruohonleikkureita eri kokoisiin pihoihin. Meiltä saat myös Stigan ajettavat ruoholeikkurit ja Suomen parhaan takuun.

Rikastavan datan lisääminen promptiin
Yksi helpoimmista tavoista rikastaa dataa tekoälyn käyttöön on lisätä data itse promptiin. Useat tekoälymallit sallivat suhteellisen ison konteksti-ikkunan eli käsiteltävän tekstin määrän, mutta esimerkiksi massiiviisia tuotetietoja prompteihin ei voida syöttää. Kaikkien tekoälymallien prompteja saakin rikastettua muun muassa kohderyhmien määrittelyillä tai brand bookilla. Jos haluat saada enemmän dataa promptiin, kuten vaikkapa kategorioiden URLeja, Googlen Gemini mallien prompteihin saa reilusti tekstiä.
Kun lisäät vaikkapa brand bookin sisältöä mukaan promptiin, saat tekoälyn kirjoittamaan yrityksenne kuuloista tekstiä. Jos taas haluat lisätä promptiin URL:eja voidaan tekoäly ohjeistaa tekemään esimerkiksi kategoriatekstejä, jossa se lisää mukaan relevantit sisäiset linkit.
Vinkit lisäämiseen
Huomioi kuitenkin että voi olla että ihmisille tehdyt dokumentit eivät itsessään ole rakennettu tekoälyn helposti käsiteltävään muotoon, jolloin saattaa olla hyvä luoda dokumenteistä itsestään prompteja ennen kuin hyötykäytät niitä. Tätä varten voit esikäsitellä vaikkapa brand bookin syöttämällä sen Chatbotille ja pyytämällä sitä tekemään promptin esimerkiksi seuraavalla tavalla: ”You are tone of voice prompter. I give you tone of voice document from brand book. Make a generalized prompt so text would be written as tone of voice suggests.”
Kun annat promptissa tekoälylle lisätietoa, on hyvä täsmentää ja erotella se muista ohjeistuksista. Voit viitata rikastettuun dataan niihin vaikkapa XML-tageilla ja pyytämällä tekoälyä käyttämään tagien sisällä olevaa tietoa.
Use tone of voice inside of <brand book> tags.
<brand book>
Liitä brand bookin sisältö tai siitä tiivistetty prompti tähän.
</brand book>

Chatbottien ominaisuuksien käyttö staattisessa datassa
Datan lisääminen promptiin on nopeaa, mutta se ei skaalaudu käyttöön niin helposti ja pitkässä keskustelussa botti saattaa alkaa ”unohtamaan” ohjeistuksia. Skaalattavampi ratkaisu on rakentaa ns. räätälöity tekoäly, jolle tiedot tallennetaan muistiin ja jonka kanssa voi aloittaa aina uuden keskustelun, kun tehdään uusi sisältö.
Esimerkiksi OpenAI:n CustomGPT tai Clauden projektit tarjoavat suhteellisen helpon tavan tallentaa edeltä mainittujen datojen lisäksi myös isompia datasettejä kuten sivustokarttoja tai tuotetietoja. Tällöin puhutaan Retrieval Augmented Generation (RAG) ominaisuudesta. RAGin toimintaperiaate perustuu siihen, että tekoäly hakee vastauksensa tueksi relevanttia tietoa laajasta tietokannasta ja käyttää sitten tätä tietoa vastauksensa muodostamiseen.
Kummatkin palveluntarjoajat tarjoavat ratkaisun, jossa voidaan helposti lähettää taustatiedostoja, joita chatbot voi joka kerta käyttää. Lisäksi chatbotille voidaan tallentaa täsmällisiä ohjeistuksia tiedostojen käyttämisestä ja työn prosessista.
RAG käytännössä
Jos vaikkapa botille lisätään verkkokaupan tuotteet sisältävä CSV tiedosto, voidaan sitä ohjeistaa tekemään relevantteja kategoriatekstejä tai esimerkiksi tuotteiden vertailuartikkeleita – ”2025 ostetuimmat kännykät”.
Haaste näissä bottiratkaisuissa on että taustalla olevat datat ovat staattisia, eli jos kauppaan tulee uusia tuotteita täytyy taustalla käytettävä tiedosto käsin päivittää.
Lisäksi ainakin omien kokemusten mukaan mitä monimutkaisempi ja monivaiheisempi tehtävä botille on sitä vaikeampia sen on suorittaa tehtävää nopeasti ja tämä vaatii käyttäjän ohjaamaan bottia eteenpäin tehtävässä. Kuitenkin verrattuna manuaaliseen chatbotin kanssa käytävään keskusteluun, tämä tapa säästää runsaasti aikaa ja olen päässyt käyttämään näitä asiakkaiden kanssa onnistuneesti.

Reaaliaikainen data käyttöön
Chatbottien kanssa työskentely ja staattisen datan hyödyntäminen tarjoavat hyvän pohjan tekoälyn kehittämiselle, mutta joskus liiketoiminnan tarpeet edellyttävät reaaliaikaisempaa datan käsittelyä. Kun siirrytään kohti reaaliaikaista dataa, on tärkeää arvioida muutoksen tuomat hyödyt ja kustannukset.
Edellämainitut tavat ovat helposti kenen tahansa markkinoijan hyödynnettävissä. Niillä saadaan ehdottomasti hyötyä ja töihin nopeutusta ja suosittelsinkin lähtemään kokeilemaan niitä, tai ottamaan valmis ratkaisu kuten kehittämäämme automatisoitu tekoälytyökalu OIKIO AI.
Reaaliaikaisen datan käyttöönotto on luonnollinen seuraava askel, jos huomaat että:
- Datanne päivittyy usein (esim. päivittäin tai viikoittain)
- Manuaalinen tiedostojen päivitys vie liikaa työaikaa
- Prosessien automatisointi toisi merkittävää lisäarvoa
Toisin kuin staattisen datan ratkaisuissa, reaaliaikainen data vaatii teknistä infrastruktuuria ja usein myös IT-osaston tukea. Kuitenkin investointi voi maksaa itsensä nopeasti takaisin, jos dataa päivitetään säännöllisesti. Käydään seuraavaksi läpi erilaisia teknisiä toteutusvaihtoehtoja.
Käytännön askeleet
Yhdistämällä tekoäly yrityksen yksityiseen dataan saadaan lisättyä entistäkin rikastetumpaa dataa, jota voidaan käyttää tekoälyn vastauksissa. Tähän datan hyödyntämisen rinnalle täytyy oletettavasti rakentaa myös käyttöliittymä tai konfikuroida jonkun muun kehittämää alustaa, jotta saadaan ratkaisu käytännölliseen hyötykäyttöön. Tämä saattaa olla laajempi IT projekti, jonka hyötyjä ja kustannuksia kannattaa arvioida.
Toisena mahdollisesti edullisempana teknisenä vaihtoehtona on hakea dataa yrityksen julkisista lähteistä. Näitä voivat olla muun muassa verkkokaupan feed tai sivustokartat. Nämäkin toimet saattavat vaatia hieman enemmän budjettia ja resursseja.
Jos halutaan reaaliaikaisempaa dataa esimerkiksi kun verkkokaupan PIMin tuotevalikoima päivittyy, täytyy tekoäly yhdistää yrityksen datalähteeseen joka päivittyy. Yleinen ratkaisu on luoda yhteys yrityksen datasta vektoritietokantaan, mutta alempana mainittu uusi MCP teknologia mahdollistaa datan pitämisen siellä missä se nykyisin on kuten esimerkiksi BigQueryssä.
Jos haluatte lähteä tutkimaan tämänkaltaisia toteutustapoja ainakin näitä kahta teknologiaa kannattaa tutkia alkuun ja ne saattavat nopeuttaa kehitystä.
1. Model Context Protocol (MCP) on Anthropicin kehittämä avoin standardi, joka mahdollistaa turvallisen kaksisuuntaisen yhteyden tekoälypohjaisten työkalujen ja erilaisten datalähteiden välillä. MCP:n avulla voidaan yhdistää tekoäly suoraan esimerkiksi Google Sheetsiin, Excel-taulukoihin tai vaikka BigQueryyn.
2. OpenAI:n Assistantilla on File search ominaisuus, jolla voi helposti käyttää heidän vektoritietokantaansa.

Yhteenveto
Lähde kokeilemaan kevyillä pilotoinneilla mitä hyötyä saat rikastamalla tekoälyn vastausta. Kokeilujen jälkeen voit miettiä laajemmin mitä dataa tarvitsisit ja tarvitseeko sen olla reaaliaikaista tai harvemmin päivitettävää. Arvioi riittävätkö omat resurssinne tai tarvitsetteko ulkopuolisen kumppanin. Jos haluatte tukea tähän, niin kehittämämme OIKIO AI tekoälytyökalu on kustannustehokas ja joustava ratkaisu, jolla saatte yrityksenne datalla rikastettuja tekoälyprosesseja nopeasti käyttöönne.
Vastausten rikastaminen datalla voidaan toteuttaa eri tasoisesti:
- Helppo aloitus: Datan lisääminen prompteihin
- Soveltuu erityisesti brand bookin ja kohderyhmämäärittelyjen hyödyntämiseen
- Suositeltava tapa pilotoinnin aloittamiseen
- Keskitaso: Chatbottien räätälöinti staattisella datalla
- Mahdollistaa laajempien datasettien kuten tuotetietojen ja sivustokarttojen hyödyntämisen
- Vaatii hieman perehtymistä tiedostojen lisäämiseen
- Edistynyt: Reaaliaikaisen datan integraatio
- Soveltuu jatkuvasti päivittyvän datan hyödyntämiseen
- Vaatii teknistä toteutusta ja mahdollisesti IT-projektin
- Tarjoaa automaattisesti päivittyvän ratkaisun