Power BI journalistin apuna

Sulava ja Microsoft järjestivät toimittajille Power BI -työpajan eduskuntavaalien 2019 alla Sulavan uudessa koulutuskeskuksessa. Mukana oli 11 datajournalismista kiinnostunutta toimittajaa Suomen kärkimedioista.

Datajournalismi, tiedon visualisointi ja infografiikka ovat olleet pinnalla median tuottamissa sisällöissä jo pidemmän aikaa. Visualisointi tekee vaikeammista aiheista kuten tilastollisesta tiedosta helpommin lähestyttäviä lukijoille ja tuo parhaimmillaan lisää personoinnin mahdollisuuksia artikkeleihin. Mutta taidot ja työvälineet datajournalismin tehokkaaseen tekemiseen ovat edelleen harvojen toimittajien osaamista tai osaaminen on mediataloissa keskittynyt erilliseen datatiimiin.

Katso esimerkki artikkelista, jossa on käytetty Power BI:llä tehtyjä visualisointeja. Tekniikka & Talous 14.2.2018: Tiesitkö, että Suomessa on seitsemän yli 100-vuotiasta ajokortinhaltijaa? – Katso minkä ikäisiä kotikuntasi autoilijat ovat

Power BI auttaa toimittajaa käsittelemään helposti suuria datamassoja esimerkiksi työstämänsä artikkelin taustatutkimukseen. Power BI tarjoaa suoraan yhteydet noin sataan tietolähteeseen ja muokkaamalla voidaan saada yhteys lähes mihin tahansa järjestelmään, joka antaa tietojaan ulos. Tietolähteitä ovat esimerkiksi tietokannat, Excel, internet-lähteet tai erilaiset tilasto-ohjelmat.

Työpajassa esimerkkinä tarkasteltiin julkista dataa valtion hankinnoista vuosilta 2018 – 2019, jossa tiedon laajuus on lähes miljoona riviä Excelissä. Tarkastelu ilman tehokkaita suodatustapoja ja visualisointeja olisi tällöin niin aikaa vievää, ettei jokaisella medialla ole siihen edes mahdollisuutta.

Kun raakadata on ensin siistitty, on muutamassa minuutissa mahdollista selvittää helposti taulukoista tai itse valitsemistaan visualisoinneista esimerkiksi kuinka paljon tietyille palveluntoimittajille on eduskunnasta tehty tilauksia. Raakadatan muokkaukseen ja siistimiseen menee aluksi hieman aikaa, koska kaikki saatavilla oleva data ei ole aina niin suoraan käyttökelpoista.

Tiedon muokkauksen työkalut Power BI:ssä ovat kuitenkin helppoja käyttää. Ne myös mahdollistavat kokeilut helposti ilman, että dataan itseensä tulee muutoksia, koska kyse on vain raporttiin, eikä itse lähdedataan tehtävistä muutoksista.

Kouluttajina työpajassa olivat Sulavat asiantuntijat Heidi Enho ja Sanna Klen.

“Power BI on alun perin kehitetty itsepalveluraportointia varten ja ohjelman käyttöönotto onkin siten tehty todella helpoksi. Ohjelmasta löytyy nykyisin todella paljon ja vahvoja ominaisuuksia myös yritystason raportointiin, mutta sama helppokäyttöisyys on edelleen säilytetty perusperiaatteena. Datan käsittelyä ja visualisointia pystyy suurelta osin hallitsemaan selkeiden käyttäjää opastavien painikkeiden avulla”, kommentoi Sanna.

Helpon visualisoinnin kautta kiinni juttuaiheisiin

Kun suuria datamääriä on helppo visualisoida, on uusien juttuaiheiden löytäminen myös toimittajalle helpompaa. Valtion hankintoja tarkastelemalla voisi löytyä esimerkiksi mielenkiintoisia painopistealuemuutoksia ostoissa, tietyn hankkeen budjetin suuruusluokka tai tulevan hankkeen aloitukseen viittaavia tietoja.

Nopeasti tehtävä visualisointi auttaa myös median aikapaineissa. Esimerkiksi eduskuntavaalien tuloksista jokaiselta medialta odotetaan nopeaa ja monipuolista raportointia. Toimitus voi raportin koostamisen sijaan käyttää enemmän aikaa itse analyysin tekoon. Jos jotain dataa kerätään aina samassa muodossa, sen visualisointi vaatii enemmän työtä vain ensimmäisellä kerralla – jatkossa visualisoinnit syntyvät ja päivittyvät napin painalluksella.

Visuaalinen sisältö on nykyisin oleellinen osa medioiden verkkopalveluja, jotka tarjoavat lukijoille personoituja kokemuksia. Heidi Enhon Vilahdus-sivustolla on väestörekisterikeskuksen avoimista tiedoista koostettu visualisointi ”Espoon väestö äidinkielen mukaan”, josta voi tarkastella kielellisen jaon kehittymistä. Raportti on syntynyt parissa tunnissa Espoon uutisen inspiroimana, kun kaupunki kertoi, että jatkossa asiointikieliä kaupungin kanssa on kolme virallista.

Tästä aiheesta media voisi painetussa lehdessä kertoa uutisen, joka sisältää yleisempää faktaa ja verkkoversiossaan tarjota lukijoilleen esimerkiksi mahdollisuuden tutkiskella tilannetta oman kaupunginosansa kohdalla. Kun uutinen on lähellä lukijaa, se lisää uutisen kiinnostavuutta.

Katso esimerkki artikkelista, jossa on käytetty Power BI:llä tehtyjä visualisointeja. Kauppalehti 5.11.2018: Veropotti kasvoi jälleen – Katso tästä kuntasi vuoden 2017 suurimmat yhteisöveronmaksajat 

Ilmoitetun vaalituen määrä yhteensä puolueittain. Eduskuntavaalit 2019 tilanne 1.4.2019

Raporttien vuorovaikutteisuus tekee niistä antoisia niin toimittajalle kuin lukijalle. Power BI:llä tuotetut visualisoinnit voivat olla hyvin yksinkertaisia ja käsitellä jotain tarkoin rajattua aihetta tai monipuolisia kokonaisuuksia, joissa käyttäjä voi itse vertailla eri asioita keskenään. Myös raporttien visuaalinen ilme on helposti mahdollista muokata esimerkiksi värien osalta median ilmeen mukaiseksi. Power BI:stä raportit on helppo julkaista suoraan verkkosivulle, joskin upotettaessa responsiivisuus kannattaa tarkastaa, jotta kokemus on hyvä erilaisilla laitteilla käyttäville.

Kolmen tunnin työpajassa journalistit saivat alkusysäyksen aloittelevaksi datajournalistiksi. Ohjelmaan kuului muun muassa miten yhdistellä aineistoja eri tietolähteistä, luoda datasta vuorovaikutteisia visualisointeja ja analysointiraportteja, ladata ja muokata dataa sekä kuinka julkaista visualisointeja ja mitkä ovat upotusmahdollisuudet artikkeleihin. Vaalikevään kynnyksellä koulutuksen esimerkkeinä käytettiin suomalaista avointa dataa, kuten Valtiontalouden tarkastusviraston vaalirahoitusvalvonnan tietoaineistoja. Katso raportti vuoden 2019 eduskuntavaalien tukien ennakkoilmoituksista