Kahvitauon mittainen johdanto markkinoinnin datavarastoon

Lukuaika min

Markkinoinnin datavarasto ratkaisee poikkeuksettoman ongelman: datan siiloutumiseen. Tässä artikkelissa kerrotaan, mikä markkinoinnin datavarasto on, mitä ongelmia se ratkaisee, mitä mahdollisuuksia se tuo sekä miten sellainen rakennetaan.

Mikä on markkinoinnin datavarasto?

Yksinkertaistettuna markkinoinnin datavarastoa (eng. marketing data warehouse) voi ajatella yhtenä isona Sheets tai Excel-tiedostona, jossa on yleensä useita taulukoita dataa. Useimmiten nykypäivänä markkinoinnin datavarasto elää esimerkiksi Googlen, Amazonin tai Microsoftin palveluissa, jolloin se mm. pystyy käsittelemään tehokkaasti huomattavasti isompaa massaa dataa kuin Sheets tai Excel-tiedosto. Yleensä puhutaan sadoista tuhansista tai miljoonista riveistä dataa, joka voi olla ”Excel-taulukon eri välilehdillä” eli datavaraston taulukoissa.

Markkinoinnin datavaraston tekee se, että varastoitava data tuodaan useista eri markkinoinnin, mainonnan, analytiikan ja parhaimmillaan myös myynnin eri järjestelmistä. Näitä järjestelmiä voi olla esimerkiksi:

  • Google Analytics
  • Google Ads
  • Google Search Console
  • Google Search Ads 360
  • Google Display & Video 360
  • Google Campaign Manager 360
  • Adform DSP
  • Facebook Ads
  • LinkedIn Ads
  • Twitter Ads
  • Salesforce CRM
  • Salesforce Marketing Cloud
  • Microsoft Dynamics 365
  • Hubspot
  • STAT
  • ja monia muita järjestelmiä

Kun markkinoinnin datavarasto on käytössä, data ei enää asu erillisissä järjestelmissä, vaan sitä pystytään yhdistelemään ratkaistaakseen esimerkiksi työaikaa vieviä ongelmia ja hyödyntääkseen erilaiset mahdollisuudet.

 

ongelmat

 

Mitä ongelmia markkinoinnin datavarasto ratkaisee?

 

Ongelma 1: Käytät omaa, tiimin tai kumppanin aikaa datan keräämiseen monesta eri järjestelmästä

Tällä hetkellä useimmissa suomalaisissa keskisuurissa ja suurissa yrityksissä käytetään paljon omaa, tiimin jäsenten tai kumppaneiden aikaa datan keräämiseen, koostamiseen ja raportointiin. Kun kerää datan automaattisesti päivittäin eri markkinoinnin, mainonnan, analytiikan ja myynnin järjestelmistä yhteen, voit(te) analysoida lukuja ja luoda raportteja käyttäen vain yhtä lähdettä – markkinoinnin datavarastoa.

 

Ongelma 2: Datan keräyksen jälkeen aika ja fokus ei riitä enää datan syvälliseen analysointiin

Tämä liittyy vahvasti edeltävään ongelmaan. Koska aikaa ja energiaa menee niin paljon datan keräämiseen, koostamiseen, raportointiin, datan “oikeellisuuden” arviointiin sekä eri järjestelmien datan erojen ihmettelyyn, aikaa ja fokusta ei riitä analysointiin. Se on kuitenkin avainasemassa datavetoisten päätösten ja liiketoiminnan tekemiseen.

 

Ongelma 3: Datan omistajuus on Googlella tai jollain muulla kuin yritykselläsi

Etenkin yksityishenkilöiden tietosuojaan liittyvien asioiden (esim. GDPR ja kolmannen osapuolen evästeet) edistymisen myötä yritykset ovat alkaneet entistä enemmän kiinnittämään huomiota datan omistajuuteen. Esimerkiksi moni maksutonta Google Analytics -versiota käyttävä yritys ei ole oivaltanut, että he keräävät datan verkkosivustoltaan Googlen omistukseen. Google tarjoaa yrityksille Google Analyticsin käyttöliittymän ja API:n kautta pääsyn kerätyn datan analysointiin.

Keräämällä kaiken markkinoinnin, mainonnan, analytiikan ja myynnin datan markkinoinnin datavarastoon on yritykselläsi mahdollisuus omistaa kaikki raportointiin ja muihin tarkoituksiin käytettävä data.

 

Ongelma 4: Dashboardien käyttö on tuskaista niiden hitauden takia

Google Data Studio on erittäin suosittu työkalu automaattisen raportoinnin rakentamiseen. Data Studiossa on monia hyviä puolia, mutta yksi sen heikkouksista on hitaus. Sitä ilmenee todennäköisimmin mitä monipuolisemmaksi dashboard rakennetaan ja se usein tarkoittaa useita eri datalähteitä, kustomoituja metriikoita ja dimensioita sekä datan yhdistelyä.

Markkinoinnin datavaraston avulla data pystytään valmistelemaan jo etukäteen ja se pystytään visualisoimaan Google Data Studiossa tai muissa suosituissa työkaluissa kuten Tableaussa (suomeksi tablööö), Microsoft Power BI:ssa, Lookerissa tai Qlikissa.

 

Ongelma 5: Et voi korjata tai muuttaa olemassa olevaa dataa

Tämä ongelma on tuttu varsinkin Google Analyticsin kanssa työskennellessä. Kun dataa on kerran lähetetty Google Analyticsiin, niin sitä ei voi jälkikäteen korjata, muuttaa tai poistaa. Jos esimerkiksi lomakkeen testilähetyksiä tuli vahingossa iso määrä tuotannon Google Analytics -tiliin, niin se on vain pakko hyväksyä raporteissa.

Markkinoinnin datavarastossa olevaa dataa voi korjata ja muokata milloin vain myös jälkikäteen. Näin saat dashboardeilla ja muille raporteille selkeää ja laadukasta dataa raportoitavaksi ja analysoitavaksi.

 

mahdollisuudet

 

Mitä markkinoinnin datavarasto mahdollistaa?

 

Mahdollisuus 1: Perustelet markkinoinnin arvon johdollesi vakuuttavammin

Yksinkertaisimmillaan markkinoinnin datavaraston avulla voit laskea digitaalisen mainonnan tuotto-panostussuhteen jakamalla mediakustannukset konversioiden määrällä. Voit sen toki tehdä ilman markkinoinnin datavarastoakin, mutta se on käsityönä usein kertaluontoista, kun taas datavarasto mahdollistaa laskennan automatisoinnin, koska data on helpommin saatavilla.

Markkinoinnin datavaraston avulla voit käyttää omaa, tiimisi tai kumppanisi aikaa datan analysointiin ja tehdä löydöksiä perustellaksesi markkinoinnin merkitystä yrityksen asiakashankinnassa ja -hoidossa.

 

Mahdollisuus 2: Rakennat liiketoiminnallesi sopivan attribuutiomallin

Useimmat digitaalisen markkinoinnin tekijät käyttävät Google Analyticsia ja kyseisen työkalun last-click (non-direct) -attribuutiomallia, joka antaa kaiken ”krediitin” kanavalle, josta käyttäjä tuli verkkosivustolle viimeisenä ennen konversiota – lukuunottamatta suoraa liikennettä. Olet varmasti ollut tai tulet olemaan keskustelussa kyseisen mallin puutteista, jolloin useimmiten todetaan sen olevan parasta, mitä on sillä hetkellä tarjolla. Jos et kuitenkaan halua tyytyä valmiisiin attribuutiomalleihin, vaihtoehtona on luoda kustomoitu attribuutiomalli. Markkinoinnin datavarastoon voi kerätä olennaisen datan mainosjärjestelmistä, analytiikkatyökaluista ja CRM:stä ja käyttää mallinnukseen esimerkiksi Google BigQuery ML:ää. Kustomoiduilla attribuutiomalleilla voit tarkastella markkinoinnin toimivuutta uusista näkökulmista ja antaa eri markkinoinnin kanaville ja toimenpiteille niiden ansaitsema arvostus.

 

Mahdollisuus 3: Luot ennustavia koneoppineita markkinoinnin mittareita

Markkinoinnin datavarasto mahdollistaa monipuolisten koneoppimismallien luonnin, joiden avulla voi esimerkiksi kehittää ennustemittareita, jotka kertovat käyttäjäryhmien oston todennäköisyyden tai ennustetun elämänkaariarvon (eng. life time value). Google on tuonut vastaavia mittareita, toistaiseksi vähän käytettyjä, myös Google Analyticsiin, joita Google on luvannut tuoda enenevissä määrin viime lokakuussa julkaistuun Google Analytics 4 -versioon. Google ei kuitenkaan tarjoile kyseisiä koneoppimisen avulla tuotettua mittareita GA-käyttöliittymän ulkopuolelle, joten se antaa entistä enemmän syytä luoda omia kustomoitua ennustemittareita.

 

Mahdollisuus 4: Yhdistät laitteet, selaimet ja käyttäjät luodaksesi profiileja

Markkinoinnin datavarasto toimii ”keskusvarastona”, jossa on mahdollista yhdistää eri markkinoinnin, mainonnan ja myynnin järjestelmien data yhteen avaindatapisteiden avulla. Useimmiten tällä tarkoitetaan pseudonyymiä dataa eli tunnisteita kuten User ID, Client ID tai Session ID. Kun sama tunniste asuu ja kulkee sujuvasti jokaisessa järjestelmässä, eri laitteiden, selaimen ja käyttäjien data pystytään nivomaan yhteen markkinoinnin datavarastossa ja muodostaa kokonaisia polkuja mm. attribuutiomallinnuksia, mainontaa tai käyttäjäanalyysiä varten.

 

Mahdollisuus 5: Varastoit yksilön dataa turvallisesti

Markkinoinnissa on herätty tosissaan viimeisen kolmen vuoden aikana yksilöiden datan varastointiin, käsittelyyn ja muihin dataturvallisuuden osa-alueisiin. Markkinoinnin datavarasto mahdollistaa datan turvallisen varastoinnin ja käsittelyn hyvin suojatussa ja keskitetyssä paikassa vähentäen tarvetta pyöritellä esimerkiksi sähköpostilistoja Excel-tiedostoissa yrityksen tietokoneilla, Google Drivessa, Microsoft Teamsissa tai ties missä. Markkinoinnin datavarasto ei missään nimessä ratkaise koko turvallisuushaastetta vaan tarjoaa mahdollisuuden aiempaa parempaan varastointiin ja käsittelyyn.

 

miten

 

 

Miten markkinoinnin datavarasto rakennetaan?

 

1. Kirkasta tavoitteet ja käyttötapaukset markkinoinnin datavarastolle

Markkinoinnin datavarastosta tulee helposti yksi markkinoinnin uusi, kiehtova ja vieläpä kallis lelu. Senpä takia markkinoinnin datavarastolle kannattaa miettiä tavoitteet erinomaisesti, kirjata ne ylös ja kommunikoida johdolle, kollegoille ja kumppaneille. Useimmiten yrityksen IT-tiimi kannattaa osallistaa työhön jo kokonaisuuden suunnittelusta lähtien, koska useimmiten vähintään tietojärjestelmien turvallisuusasiat kuuluvat heidän vastuulleen. Mikäli markkinoinnin datavaraston konkreettiset tavoitteet puuttuvat, sen tulee huomaamaan matkan varrella sotkeutuen isoon määrään uusia mielenkiintoisia mahdollisuuksia, jotka pahimmillaan passivoi ja pistää projektin pakettiin kokonaan.

 

2. Kokoa yhteen tavoitteet toteuttava asiantuntijatiimi

Digitaalisessa markkinoinnissa näkee usein budjetoitavan ison summan työkalujen hankintaan, mutta ei asiantuntijoihin, jotka käyttävät työkaluja hyödykseen.

On siis vähintään yhtä kriittistä olla suunnitelma, kuka tai ketkä tulevat tekemään työn hankituilla työkaluilla. Työ vaatii asiantuntijuutta, jota on Suomen kokoisessa maassa vielä hyvin harvassa. Lisäksi on myös hyvä huomioida jos esimerkiksi datavaraston pilvipalveluksi valitsee Snowflaken niin osaamista sen ympärillä on vähemmän kuin Google Cloudin osin. Toki työtä voi tällaiseen työhön ostaa myös ulkomailta.

 

3. Määrittele järjestelmät, kentät ja datamallit

Jo yksittäisissä markkinoinnin, mainonnan, analytiikan ja myynnin järjestelmissä on valtavasti eri dataa, jota kaikkea ei kannata viedä markkinoinnin datavarastoon. Syynä tähän on se, että jos tavoitteena on luoda selkeyttä markkinoinnin raportointiin, kaiken datan prosessoiminen ei välttämättä edistä tavoitetta. Keskity siis vain merkittävän datan prosessointiin. Toisekseen datan varastoinnilla on aina kustannuksia, jotka kasvavat lähes poikkeuksetta datan varastoinnin ja/tai prosessoinnin volyymin mukaan.

Järjestelmien, joista dataa noudetaan, sekä niiden kentät kannattaa määritellä jo tässä vaiheessa, sillä ne määrittelevät raameja tarvittaville työkaluille, joista puhutaan seuraavissa kappaleissa. Myös järjestelmien ja markkinoinnin datavaraston datamalli(t) pitää ottaa huomioon erinomaisesti, jotta työ seuraavissa vaiheissa on sujuvaa eikä aiheuta päänsärkyä, kun esimerkiksi päivämäärädata voi olla eri formaatissa eri järjestelmissä eikä yhteneväistä.

Kaikki määrittelyt kannattaa dokumentoida tarkasti, koska vaikka se on tylsää työtä, niin se maksaa itsensä varmasti takaisin myöhemmissä vaiheissa.

 

4. Valitse pilvipalvelu markkinoinnin datavarastolle

Koska Google on niin vahva pelaaja digitaalisen markkinoinnin, mainonnan ja analytiikan alalla, useimmat valitsevat markkinoinnin datavarastoksi Google BigQueryn. Sillä onkin monia hyviä puolia, koska Google BigQuery on mm.:

  1. Helppo ottaa käyttöön.
  2. Edullinen ja skaalautuva kustannuksiltaan aina maksuttomasta isoihin massoihin dataa.
  3. Integraatiot moniin eri järjestelmiin.
  4. Tehokas ja omaa hyvä suorituskyvyn.

Muita suosittuja pilvipalveluita markkinoinnin datavarastolle ovat mm. Amazon Redshift, Snowflake ja Microsoft Azure.

 

5. Valitse työkalu, jolla viet datan eri järjestelmistä markkinoinnin datavarastoon

Tässä kategoriassa työkaluja on useita ja niitä tulee jatkuvasti lisää, koska tarve kasvaa myös todella nopeasti. Suomessa suosituimpia datan siirtoon tarkoitettuja työkaluja ovat Supermetrics, Funnel.io ja Adverity. Muita vastaavia on mm. Stitch, Dataddo ja Fivetran.

Näkemykseni on, että kaikki vastaavat työkalut ovat enemmän tai vähemmän menossa samaan suuntaan. Ne ovat vain hieman eri vaiheissa ja eri tavalla toteutettuja sekä hinnoiteltuja.

Tällä hetkellä Supermetricsin tuotteet Supermetrics for BigQuery ja Supermetrics API ovat erinomaisia kuljettamaan dataa, mutta eivät muokkaamaan sitä. Uskon siihen olevan tulossa parannuksia lähikuukausina.

Funnel.io taas on datan kuljetuksen lisäksi panostanut jonkin verran enemmän käytettävyyteen ja laskenut rimaa, jotta markkinoinnin tekijät voisivat matalammalla kynnyksellä muokata ja yhdistellä sitä ennen datan hyödyntämistä. Toisaalta Funnel.io:n hinnoittelu on ollut ainakin toimistoille historiallisesti luotaan työntävä – hekin ovat sitä tosin muuttaneet tai muuttamassa selkeämmäksi ja järkevämmäksi. Jotta Funnel.ion käyttäjät voivat käsitellä dataa ennen sen lähetystä esim. Google BigQueryyn, Funnel.io tallentaa datan ”välivarastoon” (heidän omistamaan data lakeen), joka useimmiten sijaitsee Atlantin toisella puolen, joka voi olla ongelma EU-lainsäädäntöjen takia.

Adverity on panostanut hieman enemmän datan hyödyntämiseen rakentamalla dashboard-työkalun sekä kehittämällä omia tekoälykyvykkyyksiä. Jälkimmäisenä mainitut kyvykkyydet tosin ovat vielä hyvin aikaisessa vaiheessa. Lisäksi Adverityllä on kokemukseni perusteella laajin valikoima järjestelmiä, mistä dataa pystyy hakemaan, mutta datan käsittely työkalussa vaatii enemmän teknistä osaamista kuin esimerkiksi Funnel.iossa. Vaikka Adverity tarjoaa joitain valmiita malleja datan muokkaukseen niin voit silti tarvita koodausosaamista haluamiesi datamuokkausten toteuttamiseen. Tämäkin voi tosin muuttua pian, koska työkalut kehittyvät todella nopeasti.

ETL-työkalua (Extract, Transform, Load) eli datan kuljetukseen tarkoitettua järjestelmää kannattaa tarkastella vähintään kolmesta näkökulmasta:

  1. Pystyykö sillä hakemaan datan kaikista aiemmin määrittelemistäsi työkaluista / järjestelmistä?
  2. Onko inhouse-tiimissä tai kumppaneissa sellaista osaamista, jotta työkalua pystytään hyödyntämään aktiivisesti?
  3. Sopiiko työkalun hinnoittelu tavoitteisiisi ja budjettiisi?

Useimmat työkalujen toimittajat haluavat sitouttaa sinut heti vuosisopimukseen (tässä mm. Dataddo on virkistävä poikkeus), mutta neuvottelemalla voi saada esimerkiksi kolmen kuukauden kokeilujakson. Neuvotteluissa kannattaa myös huomioida ja vaatia mahdollisesti puuttuvan järjestelmän integrointi työkalun toimittajan toimesta.

 

6. Siirrä ja käsittele data

Tämä vaihe vaatii esitetyistä askelista eniten teknistä osaamista ja aikaa. Edellä mainituissa työkaluissa datan siirtäminen on tehty useimmiten melko yksinkertaiseksi, mutta riippuen tavoitteista ja suunnitelluista käyttötapauksista datan käsitteleminen sopivaksi eri järjestelmien tuottaman datan välillä ja erilaisia käyttötapauksia varten voi olla vaativaa.

Jotkin työkalut kuten Funnel.io ja Adverity mahdollistavat datan käsittelyn jo ennen markkinoinnin datavarastoon siirtämistä. Teknisesti taitavat asiantuntijat taas voivat valita tehdä datan käsittelyn SQL-kyselyillä Google BigQueryssä tai vastaavassa pilvidatavarastossa. Google Cloudissa on myös mahdollista käyttää Googlen Dataprep-työkalua, joka tarjoaa visuaalisen käyttöliittymän datan käsittelyyn ennen datan aktivointia eli käyttöönottoa

Tavoitteena on tehdä eri lähteiden datasta yhteensopivaa ja ”puhdasta”, jota voi käyttää vaivattomasti raportoinnissa, koneoppimismalleissa tai muissa käyttötarkoituksissa. Datan käsittelyt eli nk. ”transformaatiot” kannattaa visualisoida tai dokumentoida selkeästi, jotta myöhemmin on helppoa tarkastella, missä mikäkin data muuttaa muotoaan.

 

7. Aktivoi markkinoinnin datavarasto

Kun haluttu data on käyttökunnossa markkinoinnin datavarastossa, se on valmis käytettäväksi esim. Google Data Studiossa tai yrityksesi käyttämässä BI-työkalussa kuten Tableaussa tai Microsoft Power BI:ssä. Jos viet dataa Data Studioon ja olet aikaisemmin käyttänyt dashboardeja, jotka tuovat datan suoraan esimerkiksi Google Analyticsista, niin tulet huomaamaan dashboardin käytön nopeuden parantuvan huomattavasti. Toinen asia, jonka mahdollisesti huomaat hyvin nopeasti, on selkeys metriikoissa ja dimensioissa, kun ne ovat suunniteltu ja valittu etukäteen ennen datan tuomista saataville dashboardissa.

Jos tavoitteesi on käyttää markkinoinnin järjestelmien dataa koneoppimismallien rakentamiseen, suosittelen tutustumaan Google Cloud Auto ML:än mahdollisuuksiin, joka voi olla hyvä aloituspiste koneoppimismalleihin ennen oman koodin kirjoittamista.

 

Yhteenveto

Markkinoinnin datavaraston hyödyt kasvavat yrityksen markkinoinnin resurssien ja volyymin myötä. Pienelle, vaikka yhtä ravintolaa markkinoivalle, yritykselle riittää varmasti vallan mainiosti Sheets tai Excel -tyyppiset kevyemmät ratkaisut, koska ei tarvita tehokkaita myllyjä datamassojen pyörittämiseen tai pitkälle mietittyjä automatisointeja raportointia varten. Keskisuurelle ja suurelle yritykselle, jolla on useita markkinointikanavia käytössä, useampi henkilö markkinointitiimissä ja käytössään markkinointikumppaneita, näen markkinoinnin datavaraston olevan enemmänkin ehto kuin vapaaehtoinen mahdollisuus.

Elämme monimutkaisessa ja hajaantuneessa maailmassa, jolloin tarvitaan esimerkiksi raportointiin single source of truth -tyyppisiä ratkaisuja. Mielestäni jokaisella toimialalla, jossa markkinointi on tai voi olla merkittävässä roolissa yrityksen menestyksessä, tarvitaan markkinoinnin datavaraston kaltaisia ratkaisuja. Vaihtoehtona on kamppailla edellä mainittujen ongelmien kanssa ja katsoa vierestä, kun kilpailijat hyödyntävät markkinoinnin datavaraston mahdollisuudet ja ottavat yhä isompia markkinaosuuksia nenäsi edestä.

Ilpo Ryynänen

Senior Web Analyst

Rakastan numeroita, koska ne puhuvat aina totta. Työkseni autan asiakkaitamme menestymään digitaalisessa liiketoiminnassa numeroiden sekä markkinointiteknologioiden avulla. Konsultoin heitä tuloskeskeisessä digitaalisessa markkinoinnissa ja myynnissä kokonaisvaltaisesti sekä olen erikoistunut web-analytiikan tarjoamiin ratkaisuihin.