Luuletko tuntevasi Excelin – Osa 2: Power Pivot

Vaikka Excel itsessään on sen hyvin osaavalle käyttäjälle mielettömän tehokas taulukkolaskentaväline, sen Power BI -lisäosat ovat hieman kuin olisi käännetty Excelistä nupit kaakkoon ja volat täysille. Power BI for Excel on tuonut Exceliin tietojen päivitettävyyden, paremman analysointi- ja laskentatehokkuuden ja interaktiiviset datavisualisointikyvykkyydet. Power Pivot tarjoaa välineet älyn rakentamiseen BI-raportointiin ja laskentakapasiteetin tehokkaaseen ja interaktiiviseen tiedon mallintamiseen ja visualisointiin.

Power Pivotia voi luonnehtia Excelin sisäiseksi tietokannaksi, sen Big Data -moottoriksi tai analysointivälineeksi. BI-raportoinnin kannalta tässä on kyseessä liiketoimintasääntöjen soveltaminen ja datan analysointi.

Power Pivotin taulut näyttävät Excel-tauluilta, mutta on käytännössä sarakepohjainen tietokanta, joka kompressoi dataa ja pyörittää sitä muistinvaraisesti. Prosessointi tapahtuu hyvin nopeasti, vaikka Power Pivotiin olisi tuotu kymmeniä miljoonia rivejä dataa, eivätkä tiedostojen kootkaan paisu valtaviksi.

”Perus-Exceliä” suurempien datamäärien pyörittäminen nopeammin ei tapahdu kuitenkaan samoin ehdoin kuin perus-excelin puolella – Power Pivotia käyttävän täytyy opetella kourallinen uusia taitoja, mutta mikäli raportointi kuuluu työnkuvaasi, on opettelu sen vaivan arvoista.

Aikaisemmin Excelilä pystyi analysoimaan dataa yksi taulu kerrallaan, mutta taulujen lisääminen Power Pivotin tietomalliin ja yhteyksien luomien niiden välille mahdollistaa datan käytön useista tauluista. Tietomallilla tarkoitetaan siis käytännössä joukkoa tauluja ja niiden välisiä yhteyksiä.

Raportointirajapinnat Power Pivotin sisältämästä tiedosta ovat pääasiassa Power View- ja Pivot-raportit. Moni varmasti nyt mietiikin, mitä eroa Power Pivotilla on Pivot-taulukoihin. Erot eivät oikeastaan ole niinkään Pivot-taulukoiden ja Power Pivotin välillä kuin Power Pivotin tietomallin ja Excel -taulukoiden välillä, joita Pivot-taulukoissa käytetään tietolähteenä. Eli voit Pivot -taulukkoosi käyttää tietoa myös Power Pivotin sisältämästä datasta ja nyt voit yhdistää Pivot -raporttiin myös tietoja useammasta taulusta.

Lasketut arvot ja uudelleenkäytettävyys raporteilla

Yes, eli nyt päästään vihdoin sen älyn rakentamiseen, vaikkakin toki myös relaatioiden muodostaminen taulujen välille onkin myös osa sitä.

Power Pivotissa laskentaa ja logiikkaa rakennetaan DAX-kielellä (Data Analysis Expressions), joka muistuttaa jonkin verran Excelin funktioita. DAX eroaa mm. nopeudessa (mahdollistaa interaktiivisen raportoinnin) ja siinä, että siinä ei käytetä yksittäisiä soluviittauksia – ainoastaan sarake- tai -tauluviittauksia. Mielestäni sitä on myös helpompi käyttää kuin esimerkiksi monimutkaisia VLOOKUP-funktioita. Monille raporttien tekijöille myös älykkäämmin aikavertailuja tekevät funktiot ovat tärkeä lisä.

Laskentaa, esim. eri KPI:hin liittyen, Power Pivotissa voidaan tehdä lisäämällä tauluihin uusia laskennallisia sarakkeita tai laskennallisia kenttiä. Erot näiden kahden vaihtoehdon välilllä voi tiivistää siihen, että jokainen uusi uniikki sarakearvo vie pysyvästi lisää tilaa tietomallista, mutta laskennallisen kentän arvo lasketaan aina niitä käyttäessä raportilla, eli se vie lähinnä sillä hetkellä prosessointitehoa.

Tiedoston koko ei suhteellisen pienillä datamäärillä tosin ole ongelma, mutta mikäli raportointiin useita miljoonia rivejä sisältävästä tietomallista tarvitaan paljon laskentaa, voi olla hyvä miettiä tiedoston koon optimointia jo hyvissä ajoin. Noin muuten näitä arvoja voidaan käyttää hyvin samantyyppisesti keskenään Power View -raportoinnissa tai esim. Pivot-taulukkoraporteissa kenttien suodatettavina arvoina.

Näiden arvojen uudelleenkäyttö useammassa raportissa ja visualisoinnissa onkin mielestäni tässä se ydin. Vaikka joku arvo voisi olla helpompi laskea käyttämällä rivimäärien salliessa ”perus-Excelin” ominaisuuksia, niin sen käyttö muualla kuin itse siinä solussa johon arvo on laskettu, onkin jo hankalampi asia. Power Pivotin lasketut arvot taas saat käyttöösi suoraan useampaan raporttiin ja useampaan tapaan tehdä raportteja ja voit suodattaa niitä eri tavoin ja löytää niistä vielä uusia näkökulmia.

Power Pivotista ja DAX:ista on kirjoitettu useita kirjoja ja useita blogeja keskittyy vain sille, joten DAXIn hienouden avaaminen vähänkään laajemmin, etenkin verrattuna Excelin perusfunktioihin vaatisi aivan oman blogikirjoituksensa, mutta enköhän sellaisen hieman tuonnempana kirjoittele myös!

Muutama huomio vielä lopuksi:

  • Vaikka tiedon tuonti tietokannoista Power Pivotin tietomallin mahdollista suoraan Power Pivotista, on Power Query tähän tarkoitukseen monipuolisempi väline. samaan työkirjaan kannattaa käyttää joka tapauksessa vain yhtä välinettä.
  • Microsoft käyttää Power Pivotin yhteydessä usein sanaa ”portable”, jolla tarkoitetaan sitä, että tieto säilyy työkirjan sisällä sen tuonnin jälkeen eli käyttäjä ei enää tarvitse pääsyä esimerkiksi tietylle koneelle tai yhteyttä tietokantaan. Itse käyttäisin tässä tapauksessa sanaa ”siirrettävä” ja puhuisin ”kannettavasta” tai mobiilista ratkaisusta vasta siinä vaiheessa, kun raportointi on viety pilveen eli tässä tapauksessa Power BI.