Opas ja saitti julkaistu - kiitokset kaikille

Dataopas on nyt juhlavasti julkaistu: http://julkinendata.fi/.

Kiitokset kaikille projektiin osallistuneille! Nyt homma oikeastaan  alkaa =) Julkaisemme vastaisuudessakin käsityksiä avoimesta datasta
täällä sekä Qaikun #dataopas -kanavalla http://www.qaiku.com/channels/show/dataopas/.

Seuraava iso ponnistus on Apps4Finland -kilpailun valmistelu MindTrekiin 2010. Lisäksi jatkamme avoimen datan kotimaisen ekosysteemin edistämistä.

Keksitään nimi

Kansidraft

Nöyrimmät pahoitteluni avoimen toimintamallin laiminlyömisestä. Hektinen aikataulu söi posterouspäivityksen hyvät aikeet. Opas on käynyt käynyt läpi raakataittovaiheen ja kansikuvana olemme saaneet luvan käyttää viime vuoden Apps for Democracy voittajan Peter Tattersallin visualisaatiota veropuusta. Jos tämä miellyttää tilaajaa, niin eiköhn sillä mennä.

Mutta nimi! Hyvät ihmiset auttakaa meitä keksimään oppaalle hyvä nimi?

Julkaisutilaisuus järjestetään 25.3.2010 klo 10-11 Postitalolla. Tarkempi pressitiedote tästä myöhemmin.

Allekirjoittanut lähtee ansaitulle viikon lomalle. Petri ja Kari A. jäävät vielä tekemään viimeisiä modifikaatioita ja pohtimaan oppaan nimeä.

Visio

Esilukijoilta olemme saaneet suuntaavia kommentteja oppaan fokusoinnista - raakadrafteissa, kun skaala on ollut vielä jotakuinkin yhteiskunnan toiminnan murroksesta teknisten rajapintojen protokolliin. Laajan kautta koukkaisu on antanut kirjoittajille näkemystä, jota seuraavien viikkojen aikana pyrimme puristamaan lukijaystävälliseen pakettiin sopivalla fokuksella.

Ilmapiiri hallinnon datan avoimen ja maksuttoman verkkojakelun suhteen on viimeaikoina (tästä on puhuttu jo 90-luvulta lähtien) muuttunut huomattavasti positiivisempaan suuntaan. Enää ei siis ole tarvetta "keskustelun avaukselle" vaan nimenomaan käytäntöön orientoivalle oppaalle. Toisaalta ilmapiirin muutos ei etene tasaisesti maailmassa, eikä Suomessa, joten perustelut pitää sisällyttää oppaaseen ja myöskään kaikkien asioiden suhteen ei voida vielä opastaa, kun de facto parhaita käytäntöjä ole vielä kehitettykään.

Selvitystyössä pyrimme muistamaan, että datan avaaminen ei ole itseisarvo. Datan hyödyntämistä pitää kaikin keinoin tukea, sillä vain sitä kautta voidaan realisoida avoimen odotetut hyödyt. Muistin virkistämiseksi olemme hahmotelleet (tämäkin on siis draftia) visiota avoimen datan yhteiskunnasta. En tiedä jääkö tämä fokusointikierrosten jälkeen lopulliseen oppaaseen, mutta ainakin se pitää kirjoittajat kiinni laajemmassa kontekstissa.

1) Aktiivinen kansalaisuus (pitäen sisällään yrittäjyyden)
Yhteiskunnan positiivisen muutoksen tekijöitä ovat informoidut yksilöt, jotka tietävät, mitä yhteiskunnassa tapahtuu ja pystyvät ilmaisemaan itseään ja vaikuttamaan ympäristöönsä. Suomalainen yhteiskunta tukee yksilöitä kaikissa rooleissa – kansalaisina, virkamiehinä, yrittäjinä – ja kannustaa heitä toimimaan. 2010-luvun hyvinvointiyhteiskunta on aktiivisten ja voimaantuneiden kansalaisten itsensä itselleen tuottama. Hallinto avoimen datan tuottajana ja infran rakentajana toimii mahdollistajana tälle.

2) Talkoomeininki ja ketterä yhteiskunta
Avoin informaationvälitys ja läpinäkyvyys mahdollistaa laajemman näkemyksen, jolla voidaan edistää yhteistyötä ja välttää tahatonta osa-optimointia. Yhteiskunnan tasolla kyetään yksilöiden väliseen organisaatiorajat ylittävään yhteistyöhön niin, ettei samoja ongelmia tarvitse ratkoa moneen kertaan. "Not invented here -syndrooma" ei vaivaa suomalaisia, vaan organisaatioissa ollaan avoimia ulkoa tuleville ideoille, kommenteille ja tarpeille. Myöskin yhä suurempi osa tehdyn työn tuloksista leviää laajemmalle yli organisaatiorajojen. Yksilöt ja organisaatiot ovat tottuneet kokeilemiseen ja iteratiivisuuteen perustuvaan jatkuvaan kehitykseen ("perpetual beta"), joka on nopeasti muuttuvassa ja kompleksisessa ympäristössä selvästi parempi tapa toimia. Asioita ei pyritä saattamaan kerralla valmiiksi, vaan niissä voidaan edetä jatkuvasti pienin askelin riippumatta esimerkiksi vaalikausien keinotekoisista kestoista. Kaikki Suomen julkishallinnon organisaatiot tiedostavat tuottavansa dataa. Dataa käsitellään arvokkaana resurssina ja sitä avataan itsestään selvästi tavoitteena luoda infrastruktuuria ja raaka-ainetta ketterälle ja avoimelle yhteiskunnallalle.

3) Suomessa osataan hyödyntää dataa (hyvinvoinnin synnyttämiseen)
Hyvinvointi on henkistä ja sosiaalista-, taloudellista- ja ympäristön hyvinvointia, jota tulee tavoitella kestävällä tavalla. Suomi näyttää tietä tietoa ja osaamista ennakkoluulottoman demokraattisesti jakavana kansakuntana. Datan avoin jakaminen ja siihen tarvittavan infran olemassaolo on meille itsestäänselvyys. Olennaista on, että Suomalaiset osaavat hyödyntää sitä yhteiskunnallisen hyvinvoinnin lisäämiseen. Siinä vaiheessa, kun maailman datavarantojen avoimuus saavuttaa "tipping-pointin" ovat suomalaiset valmiita ja osaavia ratkomaan maailman suuria haasteita informaation hyödyntämiseen perustuen. Tasa-arvoisessa Suomessa myös yhteiskunnallisen hyvän tuottaminen avoimuuteen ja informaatioon pohjautuen on laaja-alaista.

4) Suomi mukana ja vaikuttamassa kansainvälisessä kehityksessä
Suomi on profiloitunut datan avaajaksi Euroopassa ja positiivinen maine antaa Suomalaisille erityisosaajille mahdollisuuden toimia asiantuntijoina ja yhteistyössä kansainvälisissä hankkeissa. Osaajat houkuttelevat myös perässään muita osaajia Suomeen. Suomen lainsäädännöllinen ympäristö ja dataan liittyvä osaaminen tekevät Suomesta luotettavan ja houkuttelevan datan hostausmaan pilvipalveluiden aikakaudella, Suomesta datan Sveitsi.

5) Suomalainen avoimen datan ekosysteemi
Suomeen syntyy toimiva avoimen datan ekosysteemi, jossa kansallisten tietovarojen hyödyntäminen lisääntyy merkittävästi avoimuuteen pohjautuvan yhteistyön ja teknologian avulla. Ekosysteemissä hallinnon organisaatiot, kansalaiset ja yritykset ovat kaikki paitsi tiedon käyttäjiä, myös tuottajia. Ekosysteemiä kuvaa raakadatan osalta jakaminen ja jalostuksen osalta yhteistyö. Raakadatalla ei käydä kauppaa, vaan se saatetaan helposti kaikkien toimijoiden saataville. Datan hankkimisesta vapautuneet resurssit voidaan täysimittaisesti kohdistaa sen hyödyntämiseen. Laajamittainen datan hyödyntäminen tuottaa uusia palveluita, tutkimusta ja tietoa, josta osalla on kaupallista arvoa ja osa edistää demokratiaa, sivistystä ja ihmisten arkea ilman suoria taloudellisia kytköksiä. Lisääntynyt datan hyödyntäminen heijastuu positiivisesti datan tuottamiseen lisäten jatkuvasti tietovarantojen laatua ja käytettävyyttä.

Irtiottokustannus EU:n maksimisuosituksena

Digitaalinen tiedonvälitys on arkipäiväistynyt hämmästyttävän nopeasti ja muuttanut merkittävällä tavalla ihmisten arkea, eikä muutosvauhti ainakaan näytä hidastuvan. Vielä 90-luvun alkupuolella käytiin julkishallinnossa keskusteluita siitä, pitäisikö kaikilla virastoilla olla omat nettisivut, vastaavalla tavalla nyt keskustellaan siitä, millä tavalla sosiaalinen media muuttaa virkamiesten toimintaa vai muuttaako tai pitäisikö julkishallinnon jakaa datavarantojaan koneluettavasti ja maksutta kaikille.

Lainsäädännön on vaikea pysyä mukana näin nopeassa muutoksessa. Vuonna 2003 säädetyssä julkisten tietovarantojen uudelleenkäyttöön tähtäässä EU-direktiivissä (PSI 2003) on lähtökohtana, että maksuperustaisuudesta luovutaan ja datan luovuttamisesta peritään enintään irtiottokustannukset. Irtiottokustannukset olivat direktiivin valmistelun aikana 2000-luvun alussa vielä jossain määrin perusteltuja, kun esimerkiksi CD-rom oli yleinen tapa julkaista aineistoja. Haluttiin, ettei direktiivi olisi liian tiukka vaatimalla täyttä maksuttomuutta. PSI-direktiivi vie asioita oikeaan suuntaan, mutta oman aikakautensa tuotteena (digitaalisen maailman kehityksessä 7 vuotta on iäisyys ja jos lasketaan direktiivin valmistelun alusta n. v. 2000 sijoittuu se aikajanalle ensimmäisten nettisivujen ja nykypäivän puoliväliin) siinä ei vielä otettu huomioon laadullista muutosta, vaan haluttiin lisätä, nopeuttaa ja helpottaa julkishallinnon tietovarantojen uudelleenkäyttöä sellaisen prosessin mukaisesti, kuten se oli ennenkin tapahtunut, eli pääasiassa yritykset sopimuksella irroittavat käyttöönsä jonkin aineiston.

Esimerkiksi Digiroad-aineiston saa käyttöönsä nykyisin pelkällä irtio-ottokustannuksella, joka on joitain satoja euroja koko aineistolta. Tämä on dramaattinen ero, verrattuna maksuperustaisiin rekistereihin, joiden käytöstä veloitetaan usein yli kymmenen senttiä hakua kohden, jolloin massiivisen aineiston kokonaishinnaksi tulee helposti satoja tuhansia euroja. Kun on päästy näin lähelle maksuttomuutta tuntuu omituiselta, ettei asiaa viedä loppuun asti. Sillä on helppo kuvitella, että tuo viimeinen pieni maksu ja siihen liittyvä kirjallisten sopimusten teko ja byrokratia helposti rajoittavat jopa suurimman osan aineiston käytöstä ja etenkin kokeilevasta käytöstä pois.

Tutkimus- ja koulutuskäyttö on konkreettinen esimerkki tilanteesta, jossa pelkkä aineistojen halventuminen ei vaikuttaisi niiden käyttöön, vaan vasta hintojen poistuminen kokonaan lisäisi käyttöä. Tutkimusorganisaatioissa on tyypillistä, että tutkijat haluaisivat joustavasti tehdä kokeiluja data-aineistojen hyödyntämisestä, mutta heillä ei ole käytännössä omaa valtuutusta tehdä pieniäkään hankintoja, minkä takia maksu pitäisi perustella ja pyörittää raskaan byrokratian läpi ja kokeilut jäävät usein tekemättä, mikäli aineisto ei ole saatavissa maksutta. Tätä varten on kehitetty erilaisia ratkaisuja, joissa aineisto on saatavilla tietystä paikasta (esim. CSC:n paikkatietoportaali) maksutta erityisehdoin nimenomaan tutkimus- ja koulutuskäyttöön. Tämä kuitenkin vaatii aina rajanvetoa siitä, mikä on tutkimuskäyttöä ja kun toisaalta tutkimuksen ja tutkimustulosten liiketoiminnallisen hyödyntämisen välistä raja-aitaa pyritään madaltamaan, niin rajanveto on aika turhauttavaa. Myöskin aloittelevien yritysten mahdollisuuksia päästä kiinni aineistoihin pitäisi parantaa. Tätä varten on esitetty nk. start-off sopimuksia, jonka avulla aineistoja voitaisiin tarjota nuorille yrityksille ja korvaukset tulisivat ajankohtaisiksi vasta siinä vaiheessa, kun aineisto alkaisi tuottaa tuloja (ETLA).

Yllämainittuja asiakasryhmiin tai käyttötarkoituksiin kohdistuvia hintadiskriminaatiomalleja ei kuitenkaan voida suositella niiden hyvistä tarkoitusperistä huolimatta. Ne eivät tue kokonaisvaltaisesti joustavaa aineistojen hyödyntämistä ja useampien erilaisten sopimuskäytäntöjen ylläpito vain rasittaa sekä dataa tarjoavia, että hyödyntäviä toimijoita. PSI-direktiivissä myöskin erityisesti pyritään eroon kaikista eksklusiivisista ja diskriminoivista hinnoittelu- ja sopimuskäytännöistä.

Mihin avointa dataa voidaan käyttää?

Kuva X: Avoin data mahdollistaa mm. kollektiivisen tuotannon, jossa itse tietovaranto täydentyy ja tarkentuu sitä käyttävän yhteisön toimesta. Vapaaehtoisvoimin tuotettu OpenStreetMap on mm. Tampereen keskustan jalankulkuväylien ja puistojen, sekä nimistön osalta huomattavasti Google-karttaa tarkempi.

Datan avaaminen ei ole mikään itseisarvo, vaan yhteiskunnalliset taloudelliset yms. hyödyt saadaan vasta, kun datasta jalostetaan informaatiota. Idea on siis, että todelliset hyödyt syntyvät, kun avointa dataa käyttävät "elävät palvelut" vastaavat konkreettisiin tarpeisiin, yleensä tiedon tarpeisiin, joita ihmisillä on.

Esimerkiksi vieraassa kaupungissa liikkuvalla matkalaisella voi olla tarve tietää, miten hän pääsisi nykyisestä sijainnistaan nopeimmin julkisilla kulkuneuvoilla rautatieasemalle. Matkalaisen kännykän GPS-paikannin antaa raakadataa matkalaisen sijainnista ja liikennelaitoksenlla on raakadataa julkisten kulkuneuvojen pysäkki- reitti- ja aikataulutiedoista. Nämä raakadatat, vaikka ne olisivat kuinka avoimesti netissä eivät matkalaista lohduta. Tiedon tarpeen tyydyttämiseen tarvitaan kännykkäsovellus, joka ottaa GPS:stä paikkatiedon ja asettaa sen lähtöpisteeksi, kysyy käyttäjältä määränpäätä, hakee tarvittavat tiedot liikennelaitoksen avoimen rajapinnan kautta ja esittää käyttäjälle selkeän opastuksen, mihin pysäkille hänen tulisi kävellä, minkä numeroiseen bussiin mennä ja niin edelleen. Helposti miellettävien nettisovellusten ohella avoimen datan käyttökohteita on muutama muukin. Tässä jaottelemme käyttökohteet karkeasti neljään kategoriaan: arkiset yleisölle suunnatut koostepalvelut (mashupit), tutkimus ja tuotekehitys, prosessien automatisointi sekä yhteisöllinen tuotanto (crowd sourcing).

Koostepalvelut (mashupit)
Kirjan kirjoittamisen aikaan ehdottomasti yleisin tapa hyödyntää avointa dataa ovat arkea helpottavat nettisovellukset, jotka visualisoivat, suodattavat tai kokoavat tietoa eri lähteistä ja siten auttavat vastaamaan loppukäyttäjien tiedontarpeisiin. Mashup on yleisilmaisu niin julkisille, liike-elämän kuin kansalaisten avoimen datan sovelluksille, jotka kokoavat dataa usein eri datalähteistä kaivamalla ja yhdistelemällä ja jalostavat sen ihmiselle helposti ymmärrettäväksi informaatioksi. Mashupille ei ole vielä vakiintunutta suomennosta. Tekniikan sanastokeskuksen tuore sanasto puhuu yhdistelmäpalvelusta, jota käytämme tässä. Ohjelmoijien keskuudessa puhutaan myös muun muassa remiksauksesta ja fuusauksesta. Termi juontaa juurensa alunperin musiikkilappaleiden yhdistämiseen uusiksi kappaleiksi.

Amerikkalaistoimittaja Adrian Holovaty oli kyllästynyt soittamaan joka aamu poliisilaitokselle kysyäkseen rikosraportin. Vuonna 2005, kun hän havaitsi, että raportit ovat saatavilla automaattisesti, hän yhdisti ne tuolloin vasta julkaistuun Google Maps -sovellukseen. Tuloksena oli ChicagoCrime -palvelu, josta näki lähes realiaikaisesti millaisia rikoksia on tapahtunut. Suomessa vastaavan sovelluksen teki Tilannehuone.fi, joka yhdisti Hälytyskeskuksen tilannetiedotuksen samaiseen Google Mapsiin. Tilannehuone on erittäin kätevä, kun esimerkiksi haluaa katsoa, onko syysmyrsky riehunut kesämökin tai asunnon liepeillä (Hintikka 2007).

Tutkimus ja tuotekehitys
Suuremmassa mittakaavassa tiedon louhintaa, yhdistelyä ja visualisointia voidaan tehdä tutkimus- ja tuotekehitysprojekteissa. Tällöin tavoitteena ei ole niinkään yksittäinen arkea helpottava tai hallinnon läpinäkyvyyttä lisäävä mashup, vaan kokonaan uuden tiedon synnyttäminen tai jonkin toiminnan optimointi laajaan data-aineistoon perustuen. Esimerkiksi liikennemittausten, julkisen liikenteen käyttötilastojen ja erilaisten alueita koskevien tilastojen perusteella voidaan tehdä kaupungin liikennejärjestelmää koskevia optimointimalleja tai vaikkapa yksityisen toimijan toimesta optimoida yrityksen palvelupisteverkostoa. Nykyisin erilaiset organisaatiot tekevät tämäntyyppisiä optimointeja ja ennustemallejaan (liikenneoptimointi, taloudelliset ennusteet jne.) nojautuen omiin datavarantoihinsa, mutta avoin data mahdollistaisi myös muiden organisaatioiden datavarantojen hyödyntämisen.

Automaatio
Mashuppien ja tuotekehityksen ohella dataa voidaan hyödyntää myös automaatiossa, jossa datan avulla ohjataan tai helpotetaan jotain prosessia. Esimerkiksi erilaisten nettipalveluiden yhteydessä osoite-lomakkeiden täydentämistä ja tarkistamista voidaan automatisoida postinumero- ja osoitedatan avulla. Visionäärisesti voitaisiin ajatella myös lämmitys- ja ilmastointijärjestelmiä, jotka hyödyntäisivät säädataa, sekä sähköverkon kapasiteetista kertovaa dataa ja automaattisesti ohjaisivat itseään siten, että sähkön kulutus laskisi ja etenkin kulutushuiput tasaantuisivat (smart grid). Tämä on vielä laajasti toteutumatta, mutta tämänkin suuntainen kehitys voisi nopeutua, mikäli dataa olisi saatavilla.

Kollektiinen tuotanto (Crowdsourcing)

Oma lukunsa avoimen datan hyödyissä on datan laadun paraantaminen ja kerääminen kollektiivisesti, sekä päällekkäisen työn väheneminen yhteiskäyttöisen datavarannon myötä. Englanninkielinen termi Crowdsourcing viittaa toimintaan, jossa suuri joukko tuottaa kukin omilla kontribuutioillaan kokonaisuuden, jonka tuottaminen yksittäiseltä taholta olisi ollut haastavaa ja kallista, ellei jopa mahdotonta. Esimerkiksi vapaaehtoisvoimin pala-palalta koottu Open Street Map on monin paikoin tarkkuudessaan huomattavasti yhden tahon tuottamia karttoja yksityiskohtaisempi (kts. kuva X). Julkisen datan tapauksessa on lukuisissa esimerkeissä todettu yleisön löytävän nopeasti datavarannosta virheitä ja puutteita, joita ei muutoin olisi huomattu (esim. X). Hieman erilainen sovellus julkisesta tiedosta ja crowdsourcingista on esim. opetusaineistojen yhteistuotanto, jolla on arvioitu säästettävän kahdessa vuodessa 30,000 henkilötyövuoden verran opettajien työaikaa Britanniassa kun he ovat alkaneet palvelun (TES Connect) kautta jakamaan aineistoja keskenään sen sijaan, että kaikki tuottaisivat saman opetussuunnitelman mukaisten sisältöjen opettamiseen oman aineistonsa [Putting the Frontline First s.25].

Johdatus avoimen datan ekosysteemiin

Ekosysteemiä voidaan ajatella tietyn alueen kokonaisuutena, joka koostuu alueen eliöiden ja elottomien ympäristötekijöiden toiminnallisesta kokonaisuudesta sekä sen osatekijöiden dynaamisesta vuorovaikutuksesta. Voidaan puhua esimerkiksi tietyn järven tai kunnan ekosysteemistä. 

Käytämme oppaassa ekosysteemi -vertausta siksi, että ekosysteemiin
liittyy mielikuva kokonaisuuden hyvinvoinnin tarpeellisuudesta ja oman
edun tavoittelusta osittain ekosysteemin rikkauden ja elinvoimaisuuden
kautta. Ekosysteemin tavoin, digitaalisen ulottuvuuden pienetkin
muutokset voivat vaikuttaa monin tavoin kokonaisuuteen. Aivan samoin
myös internet kokonaisuudessaan muodostaa ekosysteemin, jossa
esimerkiksi uusi www-palvelu tai netti-isku voi vaikuttaa satojen
miljoonien ihmisten arkeen ja muihin palveluihin.

Perusajatus, on, että myös datan keräämistä, jalostusta, julkaisua ja
uudelleenkäyttöä kannattaa ajatella kokonaisuutena ja eri tekijöiden
välisenä vaikutuksena, eikä niinkään markkinoina ja vaihtokauppana.

Avoimen datan ekosysteemissä hallinnon organisaatiot, kansalaiset ja
yritykset ovat kaikki paitsi tiedon käyttäjiä, niin myös tiedon
tuottajia. Niinikään siihen kuuluvat sovellukset, laitteet, valitut
yhteyskäytännöt sekä sisällöt, joita niiden avulla välitetään. Vaikka
oppaassa keskitytään nimenomaan julkishallintoon merkittävänä
informaation tuottajana, niin ekosysteemin näkökulmasta ei ole
olennaista, kuka tuottaa ja kuka käyttää informaatiota. Nykyään
tilanne saattaakin olla jo niin, että yksityiset yritykset tuottavat
jo lähes yhtä paljon dataa, kuin julkishallinnon organisaatiot ja
enenevässä määrin myös yksittäiset kansalaiset osallistuvat datan
tuotantoon ja sen jalostamiseen informaatioksi ja tiedoksi.

Tästä riippumatta julkishallinto tuottaa jatkuvasti suuren määrän
dataa, joka voisi olla tehokkaamminkin käytössä, huomioiden sen
tietovarantojen laadukkuus ja hyödyntämispotentiaali. Aikaisemmissa
keskusteluissa (mm. PSI direktiivi; kts. jakso xxx) kansalaisia tai
yksityistä sektoria ei ole pidetty osapuolena tietovarantojen
kehittämisessä, vaan ainoastaan tiedon loppukäyttäjinä. Tämä ajattelu
on jo osin muuttunut ja etenkin yritykset nähdään potentiaalisina
tiedon jalostajina. Edelleen voidaan ajatella, että yritykset voisivat
antaa oman kontribuutionsa kansallisen tietovarannon kasvattamiseen.
Siitä voisi jopa olla yritykselle hyötyä, jos niiden jakamat
tietoresurssit näin kehittyisivät.

Dataopas-ekosysteemi-draft-m

Kaavio 3.1: Alustava luonnostelu avoimen datan ekosysteemistä 


Asioiden selkiyttämiseksi pyrimme konseptuaalisesti erottamaan
toisistaan datavarantojen käyttötarkoitukset ja itse datavarannot,
sekä datan niitä tuottavista tai niiden kanssa toimivista
organisaatioista. Tämän erottelun ansiosta on helpompi nähdä, kuinka
jollekin datalle voi syntyä uuden toimijan hyödyntämänä täysin uusi
käyttötarkoitus ja myöskin saman datavarannon ylläpitovastuu voi
siirtyä toimijalta toiselle tai sen tuottamiseen voivat osallistua
useat tahot. Ekosysteemissä on paikkansa niin toimijoille, kuin datan
käyttökohteille ja itse datallekin, mutta ne eivät ole suoraan
sidoksissa toisiinsa. Käytännössä tietenkin datavarantoja ylläpidetään
jonkun organisaation toimesta ja usein mielessä on joitain
ensisijaisia käyttötarkoituksia, joilla perustellaan kyseisen
tietovarannon tärkeyttä.

 

Maksuperustelaki ajalta ennen nettiä

Suomen nykytilanne hallinnon tuottaman datan maksullisuudesta perustuu pitkälti maksuperustelakiin (1992/150). Kun informaatioyhteiskunnan ensimmäinen aalto saapui Suomeen 1980-luvulla, niin halinnon tuottamasta datasta käytiin vilkasta keskustelua. Toisaalta viitattiin tuolloin Yhdysvaltain malliin, jossa verovaroin tuotettua dataa pidetään yleishyödykkeenä. Toisaalta ajateltiin, että tuotetulla datalla pitäisi olla hinta, joka muodostuu sen tuottamisen kustannuksista. Lisäksi hallinnon tuottamalle datalle haluttiin ainakin minimihinta myös siksi, etteivät kansalaiset vaivaisi turhaan hallintoa pyynnöillään. Hinnan, on se pieni tai suuri, katsottiin vähentävän pyyntöjä ja työajan käyttöä pyyntöjen täyttämiseen.

Ennen internetin mukanaan tuomaa informaation jakelurakenteen muutosta luotiin Suomessa maksuperustelaki vuonna 1992. Se takaa hallinnon tuottaman datan saamiselle minimikustannuskorvauksen. Tuolloin julkishallinnon datan maksullisuus oli sinänsä perusteltua. Dataa piti kaivaa esiin, tulostaa ja postittaa jne. 1990-luvulla lakia yritettiin joitain kertoja muuttaa, mutta se ei päässyt valtioneuvostonkäsittelyyn ja muuttui ajan myötä käytännöksi. Valtion toimintojen liikelaitostuminen tuki tätä kehitystä, mutta käytännössä Suomessa viranomaisen tuottaman datan suurin asiakas on toinen viranomainen. "Vilkas kaupankäynti julkisilla tiedoilla on siirrellyt valtion rahaa taskusta toiseen, mutta nettotulot eivät ole lisääntyneet" (Kuronen 1998a s. 9)

Internetin myötä tilanne on oleellisesti muuttunut. Digitaalisen tiedon maailmassa voidaan alkuperäisestä tehdä täydellisiä kopioita lähes ilmaiseksi. Myös tiedon tallentaminen ja siirtäminen paikasta toiseen on erittäin kustannustehokasta, eikä tieto myöskään kulu käytössä. Hallinto voisi yksinkertaisesti ja automatisoidusti laittaa datavarantonsa tarjolle Internetiin ilman tulostelua ja postituksia. Toki tietovarantojen saattaminen esimerkiksi XML -muotoon vaatisi panostuksia, mutta itse kustannusperiaate ei enää ole perusteltu tältä osin. Pikemminkin voidaan puhua syntyneestä käytännöstä, joka ei enää vastaa nykyaikaa.

Digitaalinen tiedonvälitys on arkipäiväistynyt hämmästyttävän nopeasti ja muuttanut merkittävällä tavalla ihmisten arkea, eikä muutosvauhti ainakaan näytä hidastuvan.  Vielä 90-luvun alkupuolella käytiin julkishallinnossa keskusteluita siitä, pitäisikö kaikilla virastoilla olla omat nettisivut, vastaavalla tavalla nyt keskustellaan siitä, millä tavalla sosiaalinen media muuttaa virkamiesten toimintaa vai muuttaako tai pitäisikö julkishallinnon jakaa datavarantojaan koneluettavasti ja maksutta kaikille.

Digitalisoitumisen mukanaan tuomat muutokset ovat niin suuria, että ne muuttavat prosesseja laadullisesti. Nykyisin ei tehdä vain samaa vanhaa enemmän ja nopeammin, vaan toimijoiden roolit muuttuvat ja ihmiset tekevät automaation myötä kokonaan eri asioita. Verottaja on yksi edistyksellisimmistä toimijoista Suomessa, joka on osannut ottaa hyödyn irti digitalisoitumisesta muuttamalla sen myötä myös omia toimintamallejaan. Siinä, missä aiemmin kaikki kansalaiset tuskailivat veroilmoituksen teon kanssa tammikuussa uudisti verottaja koko prosessin siten että suurin osa kansalaisista saa verottajalta valmiin veroehdotuksen, johon tehdään vain muutokset, jos sellaisia on. Tämä säästää sekä verottajan resursseja, että kaikkien veronmaksajien aikaa ja hermoja. Digitaalisuuteen olisi voitu siirtyä myös muuttamatta prosessia esimerkiksi vain mahdollistamalla perinteisen veroilmoituksen täyttäminen myös nettilomakkeella, mutta tällöin ei oltaisi oltu aivan ajan hermolla.

Avoimen datan taloudesta

"Jos minä annan sinulle pennin, olet sinä pennin rikkaampi ja minä taas pennin köyhempi. Mutta jos annan sinulle idean, on sinulla uusi idea, mutta minulla on edelleen omani."
Sitaatti Einsteinilta

Maksuttomuus: Data on tarjolla enintään irtiottokustannuksilla, mieluiten maksutta. Mikäli erityisestä syystä peritään maksuja tulisi olla mahdollista suorittaa maksu netissä ja saada aineisto käyttöön välittömästi ilman viranomaisen työtä.

Avoimen datan rahoittaminen ja toisaalta datan avoimuuden oletetusti positiiviset taloudelliset vaikutukset ovat yleisimpiä kysymyksiä aiheen ympärillä. Luku kokoaa yhteen pitkäaikaista kotimaista keskustelua, argumentointia ja näkökulmia julkisen datan hallinnan rahoituksesta. Näitä ovat Suomen nykykäytänteiden maksuperustelaki, EU:n suosittama korkeintaan marginaalikustannuksiin perustuva hinnoittelu, hallinnon edistämä kokonaisedullisuus -ajattelu sekä eri kansainväliset ajattelutavat avoimesta datasta osana kansallista innovaatiostrategiaa. Lopuksi tarkastellaan avoimen datan mahdollisia rahoitusmalleja. Avoimen datan kokonaishyötyjä ja kumulatiivisia vaikutuksia on laskettu vielä kansainvälisestikin vähän ja taloutta käsitellään tässä pääosin esimerkkien kautta.

Informaatio on ideoinnin, keksintöjen ja innovaatioiden ajava voima. Avoimen datan taloudelliset hyödyt perustuvat ajatukseen datasta julkishyödykkeenä: digitaalisen dataa tai informaatiota voidaan kopioida loputtomasti, eikä datan käyttäminen siten vähennä sen saatavuutta muilta. Aimmin tiedon jakelua rajoittivat vähintään fyysisestä kopioinnista, paperille painamisesta ja postituksesta tai muusta logistiikasta aiheutuvat jokaista uutta kopiota koskevat marginaalikustannukset. Netissä jaettavan digitaalisen tiedon kohdalla marginaalikustannukset syntyvät lähinnä bittien siirrosta tietoverkoissa ja ovat käytännössä häviävän pienet useimpien julkishallinnon datavarantojen kohdalla. Tähän perustuu yleisemmin myös sosiaalisen median monet niin kutsutus ilmaistalouden (freeconomics) ansaintamallit. Palveluiden peruskäyttö on maksutonta, koska yksikkökustannus on niin pieni (Anderson 2008).

Luonnollisesti laadukkaiden tietovarantojen kerääminen, ylläpito  ja jakeluinfrastruktuurin teko ei ole ilmaista, vaikka jakeluun ja kopiointiin liityvät marginaalikustannukset ovatkin digitaalisuuden myötä pienentyneet. Kustannusrakenteen muuttuminen (kustannukset painottuvat enemmän tuotantoon, kuin jakeluun) on johtanut perinteisten kunstantajatoimintaan perustuneiden alojen, kuten media- ja musiikkiteollisuuden murrokseen. Näillä aloilla suuri kysymys on tekijänoikeuksista, millä muusikolle saadaan leipä pöytään, jos fyysisiä levyjä ei myydä tai miten saataisiin asiakkaat maksamaan laadukkaasta journalistisesta sisällöstä, jos kaikki on tarjolla netissä ilmaiseksi. Julkishallinnon osalta tilanne on sikäli erilainen, että julkiset organisaatiot eivät ensisijaisesti tuota informaatiota ulkopuolisten tarpeisiin, vaan tietoa kerätään hallinnon omia tarpeita, kuten verotusta, valvontaa ja päätöksentekoa varten.

Yhdysvalloissa on katsottu, että kertaalleen verovaroin tuotettu data on kaikkien saatavilla, myös USA:n ulkopuolella internetin välitykselä. Eurooppalainen nykyisin muun muassa monien paikkatietojen jakeluun sovellettu malli on maksuperustaisuus, jossa datavarannon tuottaja ja ylläpitä kattaa suuren osan kuluistaan datan maksullisesta jakelusta saamillaan tuloilla. Suomessa käytiin vastaava keskustelu 1980-luvulla, joka tuotti 1990-luvun alussa nykyisen maksuperustelain. Aiheeseen palattiin 1990-luvun puolivälissä, kun Suomi alkoi luoda tietoyhteiskuntastrategioita, mutta perusnäkemystä ei muutettu (Kuronen 1998a). Alkuperäisen maksuperustelain toimintaympäristö on tyystin muuttunut internetin sekä muun teknisen kehityksen myötä. Nykyisin maksuperustaisuus johtaa valitettavasti usein erittäin laadukkaiden datavarantojen vajaakäyttöön ja jopa saman tiedon keräämiseen useissa paikoissa. Esimerkiksi säädatan uudelleenkäyttöön perustuva riskinhallinta-liiketoimintasektori oli vuonna 2002 Yhdysvalloissa 50 kertaa suurempi, kuin Euroopassa (Weiss 2002).

Maksuperustaisuuden vaihtoehtona datan jakelun yhteydessä puhutaan maksuttomuudesta tai enintään irtiottokustannuksiin perustuvista maksuista. Maksuttomuus tarkoittaa, että datavarantojen tuotto, ylläpito ja jakelu hoidetaan kokonaan budjettivaroin. Irrotuskustannuksiin (VM 2003) perustuva maksullisuus puolestaan tarkoittaa, että datan kerääminen ja ylläpito kustannetaan budjettivaroista, mutta datan käyttäjät maksavat datan jakelusta aiheutuneet lisäkustannukset.

Datan maksuton saatavuus kaikille on yksi tekijä, joka lisää sen avoimuutta. Maksuttomuus ei tarkoita, etteikö avoimen datan ympärille voisi kehittyä liiketoimintaa, vaan päin vastoin. Parhaimpana esimerkkinä ovat avoimen lähdekoodin projektit. Ohjelmat ovat käyttäjilleen maksuttomia, mutta silti ne ovat tuottaneet merkittävän liiketoiminnan ympärilleen muun muassa tarjoamalla ohjelmistojen asennusta, käyttäjätukea, ylläpitoa sekä räätälöityä versiointia. Avoimen datan ajattelussa Suomen kokonaishyöty on suurempi kuin että hallinto laskuttaisi nykyisen maksuperustelain mukaan yksittäisistä dataeristä, joissa usein hallinto toimii sekä ostajana että myyjänä. Avoimuus on myös osa informaatioyhteiskunnan demokratiaa. Ihmiset saavat tasavertaisesti ja maksutta argumenttiensa tueksi tarvitsemansa dataa, jota he voivat jalostaa ja käyttää parhaaksi katsomallaan tavalla.

Hissipuhe - demokratia, talous, hallinnon tehokkuus

Miten selittää hallinnon avoimen datan hyödyllisyys lauseessa tai
kahdessa? Kukaan ei esimerkiksi vieläkään osaa määritellä, mitä sähkö
on, mutta silti se on kohtuullisen yleisessä käytössä. Hallinnon avoin
data on jo terminä sellainen, että se tarvitsisi akronyymin.
Puhumattakaan siitä että sen merkitys pitäisi saada vielä puristettua
tolkulliseen ja tiiviseen lauseeseen.

EVA julkaisi loppuvuodesta 2009 aika erikoisen pamfletin "Nykyaikaa
etsimässä". Raportin mukaan Suomen liike-elämä olisi erinomaisen
kilpailukykyinen, kunhan vain hallintoa leikattaisiin ja ihmiset
siirtyisivät julkishallinnosta oikeisiin töihin liike-elämään. Ja
siinä sivussa vapautettaisiin hallinnon omistama data kaupalliselle
hyödyntämiselle.

EVA on oikealla asialla, mutta päättelyketju on viime vuosituhannelta.
Esimerkiksi metsäteollisuus on irtisanonut tuhansia ihmisiä viime
vuosina ainoastaan siksi, ettei ala lähtenyt tutkimus- ja
tuotekehittelyyn 1990-luvulla. Esimerkiksi Tekesin Hybridimedia
-teknologiaohjelmalla oli lähinnä tilapäisesti työllistävä vaikutus.

Hallinnon avoin data on informaatioyhteiskunnan virtaa. Se saa
informaatioyhteiskunnan sykkimään.

Olisiko tuosta hissipuheeksi?

Suomalaiset ovat erittäin hyviä keksimään laitteita. Muut maat tekevät
bisnestä niiden soveltamisella ja niiden ympärille rakennetuilla
palveluilla. Meillä Suomessa kaivattaisiin nyt akuutisti uutta
ajattelua. Siihen ei Eteläranta pysty. Vaatimuksia on helppo esittää,
mutta mielummin olisin lukenut EVA:n katsauksen kymmenestä EVA:n
tuottamasta innovaatiosta.

Ei hallinnon avoin data sellaisenaan ratkaise mitään ellei sitä
käytetä. Onneksi Suomessa on vihdoin alkanut löytyä ihmisiä,
organisaatioita ja verkostoja, jotka ymmärtävät millaista on elämä
informaatiohteiskunnassa. Kuten SLUSH ja Sähköautot Nyt! -liike.

Sinänsä on hieman outoa, että julkishallinnon datan vapauttamista
pitää erikseen argumentoida. Jos oikein yrittää, niin ehkä keskeisin
argumentti on, että se ei maksa juuri mitään kun se on kertaalleen
tuotettu.

Hallinnon primaaritehtävä ei ole kerätä dataa, toisin kuin vaikkapa
edesmennessä DDR:ssa. Hallinnon tuottama data on sivutuote ja sen oman
toiminnan edellytys. Kun dataa kerätään, niin miksei tehtyä työtä
voisi luovuttaa kaikille kiinnostuneille?

Entä demokratia? Sitä on ollut Suomessa niin pitkään että useimmat
ottavat sen jo itsestäänselvyytenä. Monille demokratia näyttää olevan
anonyymia mielipiteen ilmaisua Suomi24:ssa ja julkkisten haukkumista.
Hyvä niin. Mutta hallinnon avoin data mahdollistaisi monia uusia
tapoja niille, jotka ovat siitä kiinnostuneita.

Haluttiin tai ei, netti tuo tyystin uudenlaista läpinäkyvyyttä
yhteiskuntaan. Yhtä hyvin voi kysyä, miksi ei?

Avoin julistus Euroopan julkisista palveluista

Kahden vuoden välein EU ministerit kokoontuvat sopimaan ministeritason sähköisen hallinnon julistuksesta (Ministerial Declaration on e-government), joka on keskeinen Eurooppalainen strateginen dokumentti. Yleensä tätä julistusta seuraa myös teollisuuden julistus. Vuoden 2009 marraskuussa EU ministerien e-government kokouksessa Malmössa esiteltiin myös kansalaisten avoimesti sosiaalisen median välineillä koostama julistus. Tämä julistus syntyi aktiivisten kansalaisten aloitteesta, joukkovoimalla netin yhteisöllisillä ideointi- (UserVoice) ja kirjoitusalustoilla (MixedInk). Myös sen suomentaminen tapahtui vapaaehtoisvoimin Suomalaisissa sosiaalisen median yhteisöissä (alustoina Qaiku, Twitter ja Etherpad).

Julistus kiteyttää loistavasti sen, mitä aktiiviset kansalaiset haluavat. Ihmiset haluavat mahdollisuuden osallistua palveluiden tuottamiseen ja mahdollisuuden käyttää julkisia palveluita alustana erikoistuneempaan toimintaan. Tällaisessa osallistumisessa avoin data on oivallinen mahdollistaja sekä informaation välittämisen kannalta, että konkreettisten sähköisten palveluiden raaka-aineena. Esimerkiksi Markus Huttunen (Essentia Solutions) teki YTV:n reittioppaaseen iPhone mobiilisovelluksen sen takia, että oli mahdollista tehdä jotain hyödyllistä ja samalla tutustua iPhone ohjelmointiin. Tässä on syytä muistaa, että myös uudet yritykset syntyvät aktiivisten kansalaisten toimesta, joten demokratiaa tukeva kansalaiskoodari on innovaattori, jollaisia tarvitaan tukemaan myös kansantaloutta.

Luonnollisesti kaikki kansalaiset eivät ole aktiivisia kaikilla elämänalueilla. Enemmistö ei puuttu julkisten palveluiden tuottamiseen saatika tee niihin omia laajennuksia tai perusta uutta liiketoimintaa. Nykymaailmassa ei olekaan enää yhtä enemmistöä, on vain kasvava joukko erilaisia vähemmistöjä. Pienempiä yhteisöjä sitovat samat tavoitteet ja voimallistuneet yksilöt ovat valmiita tekemään jotain hyödyllistä vaikka heti, kunhan tekeminen on mahdollista pilkkoa tehtävissä oleviin kontribuutioihin. En minäkään koko deklaraatiota olisi suomentanut, mutta kyllä nyt yhden lauseen voi suomentaa hyvän asian puolesta, kun muitakin innostuneita näytti olevan. Ajatuskulku onkin, että julkishallinto antaa muun muassa avoimen datan muodossa mahdollisuuden kaikenlaisille yllättävillekin kontribuutioille yrittämättä etukäteen arvata kaikkia niitä motivaatioita ja intohimoja, joita lukuisilla yhteisöillä ja yksilöillä on.

Julistustekstiin kannattaa tutustua ja suomennosta viilata vaikkapa Etherpadissa. Kirjaan laitamme ylläolevan johdannon ja julistuksen, mikäli tila antaa myöden. Tietysti pitää ehtiä ensin ottaa yhteyttä Markukseen, toistaiseksi olen jutellut vain HSL:n (entinen YTV) edustajan kanssa ja hän oli sitä mieltä, että iPhone aplikaation syntyminen oli loistojuttu.