Luuletko tuntevasi Excelin – Osa 2: Power Pivot

Vaikka Excel itsessään on sen hyvin osaavalle käyttäjälle mielettömän tehokas taulukkolaskentaväline, sen Power BI -lisäosat ovat hieman kuin olisi käännetty Excelistä nupit kaakkoon ja volat täysille. Power BI for Excel on tuonut Exceliin tietojen päivitettävyyden, paremman analysointi- ja laskentatehokkuuden ja interaktiiviset datavisualisointikyvykkyydet. Power Pivot tarjoaa välineet älyn rakentamiseen BI-raportointiin ja laskentakapasiteetin tehokkaaseen ja interaktiiviseen tiedon mallintamiseen ja visualisointiin.

Power Pivotia voi luonnehtia Excelin sisäiseksi tietokannaksi, sen Big Data -moottoriksi tai analysointivälineeksi. BI-raportoinnin kannalta tässä on kyseessä liiketoimintasääntöjen soveltaminen ja datan analysointi.

Power Pivotin taulut näyttävät Excel-tauluilta, mutta on käytännössä sarakepohjainen tietokanta, joka kompressoi dataa ja pyörittää sitä muistinvaraisesti. Prosessointi tapahtuu hyvin nopeasti, vaikka Power Pivotiin olisi tuotu kymmeniä miljoonia rivejä dataa, eivätkä tiedostojen kootkaan paisu valtaviksi.

”Perus-Exceliä” suurempien datamäärien pyörittäminen nopeammin ei tapahdu kuitenkaan samoin ehdoin kuin perus-excelin puolella – Power Pivotia käyttävän täytyy opetella kourallinen uusia taitoja, mutta mikäli raportointi kuuluu työnkuvaasi, on opettelu sen vaivan arvoista.

Aikaisemmin Excelilä pystyi analysoimaan dataa yksi taulu kerrallaan, mutta taulujen lisääminen Power Pivotin tietomalliin ja yhteyksien luomien niiden välille mahdollistaa datan käytön useista tauluista. Tietomallilla tarkoitetaan siis käytännössä joukkoa tauluja ja niiden välisiä yhteyksiä.

Raportointirajapinnat Power Pivotin sisältämästä tiedosta ovat pääasiassa Power View- ja Pivot-raportit. Moni varmasti nyt mietiikin, mitä eroa Power Pivotilla on Pivot-taulukoihin. Erot eivät oikeastaan ole niinkään Pivot-taulukoiden ja Power Pivotin välillä kuin Power Pivotin tietomallin ja Excel -taulukoiden välillä, joita Pivot-taulukoissa käytetään tietolähteenä. Eli voit Pivot -taulukkoosi käyttää tietoa myös Power Pivotin sisältämästä datasta ja nyt voit yhdistää Pivot -raporttiin myös tietoja useammasta taulusta.

Lasketut arvot ja uudelleenkäytettävyys raporteilla

Yes, eli nyt päästään vihdoin sen älyn rakentamiseen, vaikkakin toki myös relaatioiden muodostaminen taulujen välille onkin myös osa sitä.

Power Pivotissa laskentaa ja logiikkaa rakennetaan DAX-kielellä (Data Analysis Expressions), joka muistuttaa jonkin verran Excelin funktioita. DAX eroaa mm. nopeudessa (mahdollistaa interaktiivisen raportoinnin) ja siinä, että siinä ei käytetä yksittäisiä soluviittauksia – ainoastaan sarake- tai -tauluviittauksia. Mielestäni sitä on myös helpompi käyttää kuin esimerkiksi monimutkaisia VLOOKUP-funktioita. Monille raporttien tekijöille myös älykkäämmin aikavertailuja tekevät funktiot ovat tärkeä lisä.

Laskentaa, esim. eri KPI:hin liittyen, Power Pivotissa voidaan tehdä lisäämällä tauluihin uusia laskennallisia sarakkeita tai laskennallisia kenttiä. Erot näiden kahden vaihtoehdon välilllä voi tiivistää siihen, että jokainen uusi uniikki sarakearvo vie pysyvästi lisää tilaa tietomallista, mutta laskennallisen kentän arvo lasketaan aina niitä käyttäessä raportilla, eli se vie lähinnä sillä hetkellä prosessointitehoa.

Tiedoston koko ei suhteellisen pienillä datamäärillä tosin ole ongelma, mutta mikäli raportointiin useita miljoonia rivejä sisältävästä tietomallista tarvitaan paljon laskentaa, voi olla hyvä miettiä tiedoston koon optimointia jo hyvissä ajoin. Noin muuten näitä arvoja voidaan käyttää hyvin samantyyppisesti keskenään Power View -raportoinnissa tai esim. Pivot-taulukkoraporteissa kenttien suodatettavina arvoina.

Näiden arvojen uudelleenkäyttö useammassa raportissa ja visualisoinnissa onkin mielestäni tässä se ydin. Vaikka joku arvo voisi olla helpompi laskea käyttämällä rivimäärien salliessa ”perus-Excelin” ominaisuuksia, niin sen käyttö muualla kuin itse siinä solussa johon arvo on laskettu, onkin jo hankalampi asia. Power Pivotin lasketut arvot taas saat käyttöösi suoraan useampaan raporttiin ja useampaan tapaan tehdä raportteja ja voit suodattaa niitä eri tavoin ja löytää niistä vielä uusia näkökulmia.

Power Pivotista ja DAX:ista on kirjoitettu useita kirjoja ja useita blogeja keskittyy vain sille, joten DAXIn hienouden avaaminen vähänkään laajemmin, etenkin verrattuna Excelin perusfunktioihin vaatisi aivan oman blogikirjoituksensa, mutta enköhän sellaisen hieman tuonnempana kirjoittele myös!

Muutama huomio vielä lopuksi:

  • Vaikka tiedon tuonti tietokannoista Power Pivotin tietomallin mahdollista suoraan Power Pivotista, on Power Query tähän tarkoitukseen monipuolisempi väline. samaan työkirjaan kannattaa käyttää joka tapauksessa vain yhtä välinettä.
  • Microsoft käyttää Power Pivotin yhteydessä usein sanaa ”portable”, jolla tarkoitetaan sitä, että tieto säilyy työkirjan sisällä sen tuonnin jälkeen eli käyttäjä ei enää tarvitse pääsyä esimerkiksi tietylle koneelle tai yhteyttä tietokantaan. Itse käyttäisin tässä tapauksessa sanaa ”siirrettävä” ja puhuisin ”kannettavasta” tai mobiilista ratkaisusta vasta siinä vaiheessa, kun raportointi on viety pilveen eli tässä tapauksessa Power BI.

Haluatko tietää lisää Power BI -raporttien tekemisestä? Sulava järjestää aiheesta webinaarin torstaina 7.5. klo 14-15 Ilmoittaudu mukaan!


Kirjoittaja:

Luuletko tuntevasi Excelin? Osa 1: Power Query

Vaikka Excel itsessään on sen hyvin osaavalle käyttäjälle mielettömän tehokas taulukkolaskentaväline, sen Power BI -lisäosat ovat hieman kuin olisi käännetty Excelistä nupit kaakkoon ja volat täysille. Power BI for Excel on tuonut Exceliin tietojen päivitettävyyden, paremman analysointi- ja laskentatehokkuuden ja interaktiiviset datavisualisointikyvykkyydet. Power Query tarjoaa saumattoman kokemuksen datan löytämiselle, datan muokkaamiselle ja sen rikastamiselle sekä sen jakamisen tietotyöläisille, BI-ammattilaisille ja muille käyttäjille. 

Monien mielikuva Excelistä lienee sama, joka minullakin oli vielä jokin aika sitten – sillä voisi tehdä vaikka mitä ja siitä saisi varmasti irti paljon enemmän, jos vaan jaksaisi opetella. Kuitenkaan motivaatiota varsinaiseen opetteluun en löytänyt, sillä mahdollisuudet pitkäjänteisempään raportointiin ja analyysityöhön tuntuivat rajallisilta, sillä kovalla työllä tehdyt laskukaavatkin olivat kertakäyttöisiä ja jonkun muun laatimat Excel-pohjat tuntuivat olevan niin hiuskarvan varassa pystyssä, että jos vähänkään johonkin koski, niin ERROR ERROR ERROR!

No, erroreista en lupaa pääsevänne kokonaan eroon, mutta uskallan sanoa kuitenkin, että nämä käsitykset kannattaa jättää romukoppaan! Esimerkiksi Power Pivot pystyy käsittelemään miljoonia rivejä dataa, ja vielä kaatumatta, eli Excel on tätä nykyä varteenotettava raportointityökalu isoillekin datamäärille. Excelin PowerBI:n raporttien rakentaminen menee yksinkertaistettuna seuraavasti:

  1. Power Queryllä haetaan ja muokataan liiketoimintadataa
  2. ladataan se Power Pivotiin analysoitavaksi, lisätään siihen mukautettuja sarakkeita ja arvoja ja lasketaan KPI:t
  3. Power View :llä tehdään interaktiiviset visualisoinnit.

Tämän jälkeen raportit toki kannattaa jakaa PowerBI -sivustoilla ja saada raportoinnista kaikki hyöty irti. Tässä blogissa esittelen teille Power Queryn.

Power Query

Power Query on Excelin lisäosa, joka yksinkertaistaa tietojen etsintää, käyttöä ja yhteistyötä. Yksi luonnehdinta voisi olla ”Excelin mini-ETL” (extract-transform-load) eli työkalu, jolla voit hakea erilaisista lähteistä tietoa, muokata ja suodattaa tiedon haluamaasi muotoon ja ladata sen tämän jälkeen joko Excel-taulukkoon tai suoraan Power Pivotin tietomalliin. Käytännössä siis teet teet kyselyn eli yhdistät ensin Power Queryn haluamaasi tietolähteeseen, esim. SQL Serverin tai Oraclen tietokantaan, suodatat ja muokkaat sen sisältämää tietoa omiin tarpeisiisi, ja vasta tämän jälkeen Excel lataa sen työkirjaan. Tuettuja tietolähteitä ovat mm. erilaiset On Premise relaatiotietokannat, Azure, verkkosivut, OData-syötteet ja HDFS. Kyselyitä voi yhdistää toisiin kyselyihin ja yhdistää tietoa myös useista lähteistä. Kyselyitä voi myös tallentaa myöhempää käyttöä varten. Niitä voi päivittää, jolloin kysely hakee ajantasaisen tiedon lähteestä. Voit myös putsata ja rikastaa dataa Power Queryn välineillä tai käyttää erityistarpeisiin myös Power Queryn M-koodikieltä. Dataa voi siis hakea erilaisista tietokannoista (tarkempi luettelo blogin lopussa), mutta myös voit myös noutaa verkkosivuilla tai muissa tiedostoissa ja kansioissa olevaa tietoa suoraan Exceliin. Näin yhdistät eri tiedostoissa olevaa tietoa samaan tiedostoon ilman copy-paste-kikkailuita ja voit tuoda dataa myös useista tiedostoista kerralla. Tietoa voi myös etsiä suoraan haku suoraan julkisista lähteistä (Online search). Julkiset lähteet kattavat tällä hetkellä tosin vain tietyt Wikipedian, Data.govin ja Azure Marketplacen osa-alueet ja keskittyvät lähinnä U.S.A.:han. Myös Suomessa on toki paljon avointa dataa, jota voidaan hakea muilla Power Queryn keinoilla (haku verkkosivuilta tai OData syötteet jne.), vaikka niitä ei Power Queryn Online Searchin avulla löydykään. Julkisten hakujen hakupalkista löytyvät myös organisaation omat sisäiset datat, mikäli ne on tuotu Power Queryn haun piiriin  

Yhteistyömahdollisuudet Power BI -lisenssin myötä

Ok, Power Queryllä on nyt tuotu tieto Exceliin, mutta mitä sitten? Datan saaminen sopivassa muodossa Exceliin on toki vasta ensimmäinen askel, tiedon löytyminen datamassasta ja sen raportoiminen vaatii toki jatkotoimenpiteitä joko muilla Power BI -työkaluilla – Power Pivotilla ja Power Viewillä – tai ”perus-Excelin” puolella. Aiemmin mainitut yhteistyömahdollisuudet eivät myöskään vielä tulleet oikein esille, ne tulevatkin käyttöön vasta Power BI -tilauksen myötä. Omasta mielestä ne ovatkin tietotyöläisen arjen kannalta hienoimmat ominaisuudet:

  • Kyselyiden ajastettu automaattinen päivitys. Kyselyille voi asettaa automaattisen päivitysaikataulun tapahtuvaksi esimerkiksi kerran päivässä tai kerran tunnissa.
    • Kyselyt voi toki päivittää ilman lisenssiäkin kätevästi, mutta vaatii kuitenkin napin painamisen verran käsityötä ja sen erikseen muistamista.
  • Kyselyn voi myös tallentaa ja jakaa muita käyttäjiä varten. Power Query tallentaa kyselyssä tehdyt vaiheet – käyttäjä tekee omilla tunnuksillaan ja käyttöoikeuksillaan kyselyn, hän näkee miten kysely on tehty ja voi tehdä itse omiin tarpeisiinsa tarvittavat muutokset tai muokata kyselyä eteenpäin.
    • Raporttien tekijät välttyvät päällekkäiseltä työltä voidessaan käyttää uudelleen myös muiden tekemiä kyselyitä ja muokata niitä eteenpäin omiin tarpeisiinsa.
    • Valmiiden kyselyiden käyttäminen myös tuo tietokantojen kanssa vähemmän työskenteleville tietotyöläisille tiedon lähemmäksi ja helpommin lähestyttäväksi, jolloin myös kynnys käyttää niitä laskee. Kyselyitä voidaan myös sertifioida ja antaa niille kirjallinen kuvaus, jolloin käyttäjä tietää, että kyselyyn voi luottaa.
    • Kyselyn tallentaminen Data Catalogiin tallentaa
      • kyselyn nimen, kuvauksen, kyselyn käyttämän tietolähteen sijainnin, tiedon serfitioinnista, tiedon ketkä käyttäjät voivat löytää ja käyttää kyselyä, kyselyn dokumentoinnin sijainnin, näytteen datasta, mikäli näin halutaan.
      • Datan muokkauksessa tehdyt vaiheet, jolloin kyselyä käyttävä henkilö näkee mitkä transformaatiot tiedolle tehdään ennen latausta Exceliin
      • Kyselyn jakaminen EI siis tallenna itse dataa
  • Organisaation tietolähteiden tuominen haun piiriin
    • Mahdollista julkistaa organisaation sisäistä On Premise -dataa löytyväksi suoraan Online-hausta
    • Käyttäjien ei tarvitse tietää, missä tietokanta sijaitsee voidakseen saada sen käyttöön. Tarvittavat käyttöoikeudet tietoon riittävät. Voit tarkastella analytiikkaa kyselyiden käytöstä – näet mitä kyselyitä käytetään paljon – ja voit hallita tallennettuja kyselyitä, mm. sertifioida tai muuttaa kyselyä.

Power Queryn tukemat tietolähteet

  • Tietokannat: SQL Server, Access, SQL Server Analysis Services, Oracle, IBM DB2, MySQL, PostgreSQL, Sybase, Teradata
  • Azure: Azure SQL tietokanta, Azure HDInsight, Azure Blob Storage, Azure Table Storage, Azure Marketplace
  • Muut: SharePoint-lista, OData-syöte, Dynamics CRM Online, Hadoop (HDFS), Active Directory, Microsoft Exchange Server, Facebook, SAP BusinessObjects BI Universe, Salesforce Objects ja Salesforce Reports, ODBC
  • Verkkosivut: Hae URLin perustella verkkosivulla oleva tieto suoraan Exceliin
  • Tiedostot (Excel-tiedosto, CSV, XML, tekstitiedosto)
  • Haku suoraan julkisista lähteistä

Haluatko tietää lisää Power BI -raporttien tekemisestä? Sulava järjestää aiheesta webinaarin torstaina 7.5. klo 14-15 Ilmoittaudu mukaan!


Kirjoittaja:

Power BI for Office 365– tiedon etsimisestä tiedon löytämiseen

Muuttuvan datan maailma vaatii uuden tavan käsitellä ja tuottaa tietoa. Microsoftin vastaus näihin haasteisiin on PowerBI. Tämä blogikirjoitus on PowerBI-blogisarjan ensimmäinen osa. Kuule lisää PowerBI:stä Sulavan järjestämässä webcastissa 24.2. Ilmoittaudu mukaan!

Kuulostaako tämä tutulta: Liiketoimintakriittiset raportit ovat eri järjestelmien syövereissä ja oikeastaan ne ovatkin jo vanhentuneita siinä vaiheessa kun niiden perusteella pitäisi tehdä päätöksiä ja toimenpiteitä. Oman työn kannalta tärkeään dataan pääsy helpottaisi arkea, mutta sitä on miltei mahdoton saada käsiteltävään muotoon ilman että pää hajoaa, eikä IT-osastollakaan ole käteviä tapoja tuoda dataa lähelle!

Entä haluaisitko päästä syventymään raporttien sisältämään tietoon eri näkökulmista kuin mihin valmiiksi pureskellut staattiset raportit antavat mahdollisuuden. Ja haluaisitko itse etsiä ja löytää liiketoimintadatasta mielenkiintoista tietoa ja yhdistellä eri tietolähteistä saatavaa dataa interaktiiviseksi raportiksi ja vielä kätevästi?

Muuttuva datan maailma

Datan määrä kasvaa hurjaa vauhtia. Tilanteet muuttuvat nopeasti ja ajankohtaista tietoa tarvitaan nopeasti ja luotettavasti – viikon vanha raportti voi olla jo vanhentunutta tietoa. Datan määrän lisäksi datatyyppien ja datalähteiden määrä kasvaa jatkuvasti ja on entistä tärkeämpää myös saada yhdistettyä dataa eri tyypeistä ja lähteistä, myös julkisista lähteistä.

KuluttajistuminenIT:n kuluttajistumisen merkitystä ei kukaan enää kiistäne – loppukäyttäjät haluavat päättää missä he töitään tekevät ja millä välineellä, joten myös BI-työkalun tulee toimia näillä ehdoilla. Kaikilla pitäisi olla pääsy dataan, jota he työssään tarvitsevat!

PowerBI for Office 365 rientää apuun!

Vastauksena mm. näihin haasteisiin Microsoft on kehittänyt (ja kehittää jatkuvasti eteenpäin) pilvipalveluna toimivan data-analytiikkapalvelun, PowerBI for Office 365:n, jonka ensisijaisena kohderyhmänä ovat ei-tekniset liiketoimintakäyttäjät, joilla on tarve päästä raportteihin käsiksi ajasta, paikasta ja laitteesta riippumatta. Palvelun muita keskeisiä piirteitä ovat raporttien tekijöiden näkökulmasta niiden vaivaton koostaminen ja jakaminen sekä ajantasaisena pitäminen, kuluttajien näkökulmasta raporttien visuaalisuus ja mahdollisuus pureutua raporteissa olevaan tietoon ja IT-osaston näkökulmasta puitteiden luominen yhteistyön mahdollistavalle, mutta silti suojatulle pääsylle tietovarantoihin ja mahdollisuus eri tietolähteiden ja datatyyppien tuominen yhteen analysoitavaksi ja mallinnettavaksi.

PowerBI for Office 365 toimii saumattomasti Excelin ilmaiseksi ladattavissa olevien (*) ja jatkuvasti kehittyvien Power BI for Excel analytiikkatyökalujen  kanssa ja yhdessä ne muodostavat itsepalvelu-BI :n kaikelle datallesi, kuten Microsoft itse asian ilmaisee. Osa ominaisuuksista on siis Exceliin ilmaiseksi ladattavissa, osa taas vaatii PowerBI-lisenssin.

Kuulostaa monimutkaiselta, tiedän. Moni asia hahmottuu selkeämmäksi audiovisuaalisen esityksen avulla, joten onneksi Microsoft on tehnyt puolestani 2 minuuttisen sellaisen, tiivistelmän PowerBI:n teeseistä. (**)

Itsepalvelu häh?

lähteet

Raportteihin kiinni pääseminen ajasta ja paikasta riippumatta kuulostaa kyllä jo itsessään hyödylliseltä, mutta tarvitsenko ihan oikeasti itsepalveluominaisuuksia niiden staattisten raporttien lisäksi, mitä meillä jo on, jossain, kai? Ja mitä se itsepalvelu nyt edes tarkoittaa?

 

Kevyimmillään itsepalvelu tarkoittaa tässä tapauksessa käyttäjälle tehtyjä interaktiivisia PowerView-raportteja, jotka mahdollistavat liiketoimintadatan syvemmän tarkastelun ja tutkimisen ja jotka löytyvät personoidusta dashboardista.

Kehittyneemmällä tasolla se tarkoittaa esimerkiksi sitä, että käyttäjät voivat itse tehdä ja muokata Power Queryllä kyselyitä yrityksen tietokantoihin ja jakaa omia kyselyitä uudelleen käytettäväksi muille käyttäjille, rakentaa niistä tietomalleja Power Pivotin avulla ja tehdä niistä raportteja PowerViewillä tai Power Mapillä.

Itsepalveluomiravintolatnaisuudet siis mahdollistavat mm. sen, että käyttäjä saa datasta tarvitsemansa tiedon irti ilman, että käyttäjän tarvitsee pyytää tätä tietoa erikseen raporttien tekijöiltä.

 

 

 

 

Analysoi ja tee yhteistyötä

Eli siis PowerBI onkin Excel + Office 365? Lyhyt vastaus on “kyllä ja ei”. Keskipitkä vastaus on, että tällä hetkellä saatavilla oleva versio PowerBI: stä on juurikin Excelin analytiikkatyökaluilla tehdyt raportit + Power BI for Office 365:n mahdollistama yhteistyö, Q&A eli luonnollisen kielen kysely  ja mobiilius. Hieman saattaa myös hämmentää se, että osa Excelin toiminnoista laajentuvat PowerBI for Office 365 -lisenssin myötä! Mutta ei huolta, kerron näistä tarkemmin tulevissa blogikirjoituksissa.

powerbi

Edelliseen kysymykseen vielä pidempi vastaus seuraa myöhemmässä blogikirjoituksessa. Pieni hehkutus on kuitenkin paikallaan – Microsoft on jo julkaissut katsauksen seuraavan sukupolven Office 365 -riippumattomaan PowerBI :hin, ilmaiseksi ladattavan Excel-riippumattoman PowerBI Designerin, natiivin iOS sovelluksen ja muutenkin tuomassa sitä lähemmäs valtavirtaa. Microsoft on siis todella panostamassa tähän!

Haluatko tietää lisää?

Sulava järjestää tunnin mittaisen webcastin Power BI:n tiimoilta tiistaina 24.2. klo 13-14  Ilmoittaudu mukaan täällä!

(*) PowerBI for Excel lisäosia voidaan asentaa seuraaviin Office versioihin

  • Microsoft Office 2010 Professional Plus SA-ylläpidolla
  • Microsoft Office 2013 Professional Plus, Office 365 ProPlus tai erillinen Excel 2013

Lataa Power Query

Lisää Power Pivot

Lisää Power View 

(**) Tässä lisäksi pari videolinkkiä, ensimmäinen 19 min ja toinen 72 min.

https://www.youtube.com/watch?v=caV56k1AUQk