Email matias@matter.fi Soita +358 40 709 6651

Koneoppiminen markkinoinnissa

 

“Oispa dataa”, sanoi markkinointipäättäjä. Nimittäin riittävän ja relevantin datan määrittely sekä kerääminen voi olla hyvinkin haastavaa. Eivätkä haasteet lopu siihen: kun dataa on kerätty, pitäisi sitä pystyä analysoimaan tehokkaasti, hyvän päätöksenteon tueksi. Tässä vaiheessa markkinointipäättäjä saattaa jo ajatella: “oispa kaljaa”.

 

Mutta koneoppiminen voi auttaa. Yritämme tässä artikkelissa osaltamme selvittää sitä, mitä määrittelyltäänkin hieman epäselvä koneoppiminen tarkoittaa, ja miten sitä voidaan soveltaa markkinoinnissa. Gartner ennustaa, että vuonna 2020 85% yritysten kohtaamisista asiakkaiden kanssa hoidetaan ilman ihmisen mukanaoloa, joten aihe on ajankohtainen juuri nyt.

 

Mitä on koneoppiminen

Aivan kuten tekoäly, myös koneoppimisen tarkka määrittely on jonkin verran epätarkkaa, koska myös päällekkäisyyksiä muiden alojen kanssa on paljon. Yritetään silti kiteyttää: koneoppimisella tarkoitetaan systeemejä jotka kehittävät suoritustaan niille annetuissa tehtävissä kokemusten ja datan karttuessa. Koneoppimisesta puhuttaessa siis yhdistellään erilaisia analyysimenetelmiä, dataa ja koodia, tavoitteena suoriutua määritellyistä tehtävistä datasta löydettyihin säännönmukaisuuksiin perustuen.

Hankalaa? Kyllä, hieman. Lisäksi esimerkiksi Witten, Frank, Hall and Pal (2017)* eivät anna selkeää määritelmää koneoppimiselle, koska on aika vaikeaa löytää tarkkaa määritelmää sille, mitä oppimisella tässä yhteydessä tarkoitetaan. He keskittyvät käytännölliseen puoleen, eli käyttämään tekniikoita joilla voi löytää säännönmukaisuuksia datasta, jotka tarjoavat oivalluksia tai välineitä nopeaan ja tarkkaan päätöksentekoon.

Koneoppiminen auttaa ihmisiä ratkomaan ongelmia tehokkaammin. Se on siis ennen kaikkea työkalu ihmisen käyttöön. Koneoppimisalgoritmit löytävät helposti sellaisia säännönmukaisuuksia isoista aineistojoukoista, joita ihminen ei löydä, sekä suorittaa ihmiseltäkin luonnistuvat tehtävät moninkertaisesti nopeammin.

 

Mikä ei ole koneoppimista

Koneoppimista pidetään herkästi samana asiana kuin tekoäly ja tilastotiede, vieläpä samanaikaisesti. Tämä johtuu siitä, että päällekkäisyyttä näiden kanssa on huomattavasti.

Koneoppimisen juuret ovat tietojenkäsittelyopissa (computer science) ja tilastotieteessä, eli tarkoitus on myös synnyttää ymmärrystä dataan pohjaten. Siinä mielessä kyse onkin samasta asiasta, mutta ehkäpä juuri käsite “oppiminen” tekee tässä eron etenkin tilastotieteeseen: koneoppiminen on luonteeltaan jatkuvan oppimisen prosessi jonka avulla on tarkoitus kehittää suoritusta vaikka loputtomasti, siinä missä samoja menetelmiäkin soveltava tilastotiede keskittyy ehkä enemmän tarkkaan rajatun kohdejoukon ja siitä kerätyn datan analysoimiseen ja johtopäätösten tekemiseen näiden analyysien pohjalta.

Koneoppiminen ei ole sama asia kuin tekoäly, jonka määrittely vasta syvissä vesissä liikkuukin. Koneoppiminen on kuitenkin tekoälyyn kuuluva, mutta sille alisteinen osa, koska oppiminenhan on älyn, myös tekoälyn, keskeinen elementti. Siten koneoppiminen on keskeinen työkalu, jonka avulla tekoälyn sovelluksia voidaan rakentaa.

 

Koneoppimisen tasoja ja menetelmiä

Koneoppimisessa määritellään yleisesti olevan kolme pääasiallista lähestymistapaa, joskin nämäkin määrittelyt ovat rajoiltaan välillä epäselviä ja osin päällekkäisiä. Valittu lähestymistapa riippuu yleensä ongelmasta jota pyritään ratkaisemaan. Käännökset ovat kirjoittajien omia ja vapaamuotoisia.

 

Supervised learning, ohjattu koneoppiminen

Ohjattu oppiminen tarkoittaa käytännössä sitä, että algoritmille kerrotaan oikeat vastaukset, eli mihin sen pitäisi datan perusteella saada asiat rajattua.  Ennalta on siis tiedossa, minkälaisiin kysymyksiin halutaan tietyt oikeat vastaukset, ja algoritmin tehtävä on löytää malli joka tuottaa halutut tulokset mahdollisimman tarkasti.

 

Unsupervised learning, vapaa koneoppiminen

Vapaassa tilanteessa saatavista tuloksista ei ole tarkkaa tietoa etukäteen. Algoritmin tehtävä on itsenäisesti selvittää, mitä säännönmukaisuuksia datasta on löydettävissä, ja tuottaa esimerkiksi luokitteluja tämän perusteella. Tämä on kätevää, mutta suorituksen laatua ja mallin luotettavuutta on hankalampaa arvioida kuin tilanteessa, jossa tiedetään mitä ollaan hakemassa ja vertailu aiempaan dataan on mahdollista.

 

Reinforcement learning, vahvistettu koneoppiminen

Vahvistettu oppiminen tarkoittaa tilannetta, jossa suorituksesta on mahdollista saada jälkikäteen palautetta, jonka perusteella suoritusta voidaan jälleen kehittää oikean palautteen suuntaan.

 

Kun lähestymistapoihin on tehty selvyyttä, on vielä hyvä huomata, että konkreettisia menetelmiä joita koneoppimisessa käytetään, on hyvin paljon. Tyypillisiä menetelmiä ovat esimerkiksi kolme seuraavaa:

 

K-means klusterianalyysi

K-means klusterianalyysi auttaa muodostamaan datasta erilaisia ryhmiä, jotka eroavat ominaisuuksiltaan toisistaan. Klusterointia voidaan hyödyntää siis löytämään tietueiden välisiä yhtäläisyyksiä, jotka auttavat muodostamaan joukkoja säännönmukaisuuksiin perustuen.

 

Lineaarinen regressio

Lineaarisella regressioanalyysillä pyritään selvittämään valikoitujen selittävien tekijöiden kykyä selittää jotakin mielenkiinnon kohteena olevaa asiaa. Sen avulla voidaan siis kertoa, että mitä tapahtuu mielenkiinnon kohteena olevalle tulokselle (vaikkapa ihmisen vuosipalkka), kun selittävien tekijöiden arvo muuttuu (esimerkiksi ihmisen koulutustaso kasvaa). Kiinnostuksen kohteena olevan tuloksen täytyy olla numeerinen, eikä se ole sidottu ennalta määrättyihin vastausvaihtoehtoihin.

 

Logistinen regressio

Logistinen regressio antaa vastauksia kyllä/ei -kysymyksiin, eli datan pohjalta pyritään selittämään onko asia jotakin vai ei? Kuten lineaarisessa regressioanalyysissäkin, myös nyt mukana on selittäviä tekijöitä, jotka joko lisäävät tai pienentävät todennäköisyyttä että haluttu asia on kyllä tai ei. Koko mallin toimivuutta voidaan arvioida sen perusteella, kuinka hyvin valitut selittävät tekijät kykenevät luokittelemaan asioita kyllä ja ei luokkiin.

 

Miten koneoppiminen auttaa markkinoinnissa – 7 esimerkkiä

Koneoppiminen voi auttaa virtaviivaistamaan markkinoinnin prosesseja ja tehostamaan liiketoimintaa monilla eri tavoilla. Tässä muutama esimerkki. Näissä on kuitenkin aina muistettava, että riittävää ja relevanttia dataa (oispa dataa) on ensin oltava kerättynä, ennen kuin analyysia (oispa kaljaa) voidaan tehdä. Lisäksi tämä data on saatava sellaiseen muotoon, että sitä voi analyyseissä käyttää (oispa enemmän kaljaa).

 

Segmentointi

Klusterianalyysi voi ensin auttaa tunnistamaan eri asiakassegmenttejä, ja segmenttien selittäviä tekijöitä, eli sitä mihin segmentit perustuvat, ja mitä yhteistä niihin kuuluvilla ihmisillä on. Tämän jälkeen uudet asiakkaat voidaan luokitella segmenttien perusteella oikeisiin luokkiin. Tämä auttaa markkinoinnin kohdentamisessa: oikea viesti oikeille ihmisille.

 

Hinnoittelu

Toteutuneiden kauppojen ja hintojen perusteella voidaan optimoida hinnoittelua lineaarisen regression avulla. Hinnanmuutosten vaikutusten ennustaminen myyntiin auttaa sekä budjetoimaan että hinnoittelemaan tehokkaammin.

 

Asiakaspoistuman ennustaminen

Tulevaa asiakaspoistumaa voi esimerkiksi pyrkiä ennustamaan keräämällä kaikki data poistuneista asiakkaista, ja etsimään yhtäläisyyksiä. Tämä voi jopa tarjota mahdollisuuksia pyrkiä estämään poistumaa. Jos esimerkiksi käyttäytymisessä näkyy muutoksia ennen asiakkuuden päättämistä, voidaan käyttäytymiseen pyrkiä puuttumaan ajoissa. Toisaalta voidaan pysyä ylipäänsä kartalla tulevasta asiakaspoistumasta ja ennakoida tarvittavia myynnin ja markkinoinnin toimenpiteitä.

 

Asiakkaan elinkaariarvon ennustaminen

Kääntäen edelliseen verrattuna, jos asiakkuudet ovat pitkiä ja ostot toistuvia, voidaan samalla menetelmällä kuin edellä ennustaa myös asiakkaiden elinkaariarvoa: mitä asiakkuuksissa on odotettavissa perustuen vanhaan dataan.

 

Markkinointiviestinnän investoinnit

Offline-maailmassa tämä on kallista ja aikaavievää, vaatien kymmeniä kampanjoita, joita muuttelemalla voitaisiin muutokset tuloksessa osoittaa. Digiympäristössä palaute toimii reaaliajassa. Lineaarisen regression avulla voidaan investointien määrää ja laatua optimoida jatkuvasti kohti myynnin kasvua. Mainonnan saralla on jo vanha asia ennustaa mainokset, joista tietty kohdehenkilö todennäköisimmin pitää tai joihin hän reagoi, ja näyttää juuri niitä mainoksia.

 

Asiakkaan hankintakulu

Jos kaikki asiakashankintaan liittyvät kulut sekä toimenpiteet asiakkaittain on selvitettävissä, voidaan hankintakuluja pienentää vähentämällä tehottomimpia toimenpiteitä ja keskittymällä tehokkaampiin.

 

Tuleeko liidistä asiakas

Kun liidien käyttäytymistä ja muuttumista asiakkaaksi voidaan mitata, pystytään logistisen regression perusteella vastata siihen, onko tietystä liidistä tulossa asiakas ja jopa siihen että mikä on todennäköisyys asiakkaan saamiselle. Tämä auttaa esimerkiksi myyntiponnisteluiden kohdentamisessa kannattavimpiin liideihin.

 

Yhteenveto

Maailma on todennäköisesti siirtymässä tällä hetkellä kovaa vauhtia tekoälyn aikakauteen, ja koneoppimisen algoritmit ovat kehityksen vahvana pohjana. Koneoppimisen avulla voidaan tietystä datasta löytää malleja ja riippuvaisuussuhteita, ja muodostaa sen perusteella ymmärrystä eri ilmiöistä, tai tehdä ennusteita tulevaisuudesta. Koneoppimista voidaan hyödyntää monipuolisesti useilla eri aloilla, kuten vaikkapa asiakastyytyväisyyden mittaamisessa, markkinatrendien selvittämisessä, riskien arvioimisessa, terveyden seurannassa, karttapalveluiden reittien optimoimisessa, suositteluohjelmissa ja vaikkapa sähköpostien automaattisten vastausten laatimisessa.

Markkinoinnin osalta esimerkiksi markkinoinnin automaatio auttaa jo monessa mainituista asioista tälläkin hetkellä. Työkalujen hyödyntäminen ei kuitenkaan vaikuta vielä olevan aivan täysimääräistä. Johtuneeko tämä siitä että asian koetaan vaativan liikaa investointeja? Koetaanko datan kerääminen liian haastavaksi?

Oleellista onkin oivaltaa, että tilanteessa kuin tilanteessa on olemassa paljon tekijöitä jotka vaikuttava lopputulokseen. Analyysit jäävät vaillinaisiksi jos vain todetaan että asiat toimivat. Syvällistä ymmärrystä syntyy kun tiedetään, että miksi asiat toimivat – mitkä ovat ne tekijät jotka kulloinkin vaikuttavat lopputulokseen eniten. Jos tiettyyn pisteeseen, kuten uuden asiakkaan saamiseen, saadaan kytkettyä paljon dataa, niin näitä selittäviä tekijöitä kyllä löytyy. Ensin täytyy kuitenkin selvittää tarkkaan se, mitä tietoa tarvitaan, sekä se, mistä sitä saadaan.

 

Samu Watanen

Jukka Utriainen

 

*Lähdeviite: Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2016). Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann.