Dette dokumentet kan også lastes ned som PDF eller som EPUB.

Om dokumentet

Del 1 er skrevet av Difi ved Heather Broomfield og Øystein Åsnes. Bidragsytere: Øyvind Grinde, Livar Bergheim og Marta Kari Schawlann.

Status for de 5 sektorene (Del 2), er beskrevet av ansvarlig departement for hvert område. Kontaktpersoner i departementene: kart- og eiendomsdata; Kari Strande (Kommunal- og moderniseringsdepartementet) transportsektoren; Ida Monclair (Samferdelsdepartementet), statlige utgifter; Astri Tverstøl (Finansdepartementet), forskning; Hanne Monclair (Kunnskapsdepartementet), kultur; Bjørn Olav Tveit (Kulturdepartementet).

Dokumentet blir oppdatert ved behov. Sist endret: 14.07.2017

Innledning

Det offentlige produserer store mengder data i sin saksbehandling og myndighetsutøvelse. Tilgang på data, og kunnskap om hvordan de kan brukes, er i økende grad en forutsetning for å kunne ta beslutninger, utvikle nye tjenester og å utøve et åpent og opplyst demokrati. Data blir i økende grad brukt i andre sammenhenger, til andre formål og av andre aktører enn det som var utgangspunktet da informasjonen ble skapt.

Økt tilgang på offentlige data og kunnskap om hvordan de kan brukes, er viktig for å legge til rette for størst mulig verdiskapning i en stadig mer datadrevet økonomi. Regjeringen har derfor valgt ut fem sektorer der det skal lages strategier (og eventuelle handlingsplaner) for økt tilgjengeliggjøring av offentlige data. Som et ledd i dette arbeidet har Difi fått i oppdrag av Kommunal- og moderniseringsdepartementet (KMD) å publisere et kunnskapsgrunnlag som skal gi oversikt over nå-situasjonen og en beskrivelse av kjente utfordringer for områdene statlige utgifter, transport, kart- og eiendomsdata, kultur og forskning. Formålet er å bidra til å identifisere mulige tiltak i form av prioriteringer, beslutninger og avklaringer for å nå målet om økt tilgang på data fra de fem sektorene.

Dokumentet er basert på innspill fra sektorene, kommunikasjon med brukere, internasjonale indekser, ulike strategier og rapporter samt Difis fagkompetanse. Del 1 begynner med en oppsummering av Norges status internasjonalt. Dette blir etterfulgt av en status for åpne data i Norge og deretter en beskrivelse av felles utfordringer og suksessfaktorer som vi har identifisert i prosessen. De sektorvise beskrivelsene av nå-situasjonen utgjør del 2.

Norges og sektorenes status internasjonalt

Kartlegging av status for åpne data internasjonalt er forholdsvis modent og gjennomføres systematisk. Det to viktigste indeksene, Global Open Data Index og Open Data Barometer, har Norge på henholdsvis en 10.- og 17.- plass i 2015. Dette er ned fra en topp 5-plassering i begge indeksene i 2013. EUs egne kartleggingsrapporter viser et lignende mønster for Norge. Selv om Norge blir sett på som en “fast tracker”, er vi ikke blant gruppen av land som er trendsettere.

Kart- og eiendomsdata er utvilsomt en av de mest etterspurte datasettene internasjonalt. EUs Guidelines on recommended standard licence, datasets and charging for the re-use of documents og The International Open Data Charter trekker frem kart- og eiendomsdata som spesielt verdifulle og at tilgjengeliggjøring av disse dataene må prioriteres. Begge indeksene som er nevnt i innledningen, har kart- og eiendomsdata som indikatorer i sine rangeringer. Norge skårer høyt på kartdata, men svært lavt på tilgang til eiendomsdata. Her bør det være handlingsrom til å gjøre mer data tilgjengelig også i Norge.

Det finnes lite sammenlignbare tall for åpne kulturdata i Norge og kultursektoren i Europa. Likevel har vi tall som indikerer at situasjonen er noe bedre i Norge og Norden enn i Europa for øvrig. Større åpenhet og transparens generelt i forvaltningen kan ha bidratt positivt også i kultursektoren. Norge er den tredje største bidragsyteren til Europeana (regnet i totalt antall etter Nederland og Tyskland) og den desidert største bidragsyteren regnet per innbygger. Det Europeana-eide prosjektet Enumerate leverte tall i sin rapport Survey Report on Digitisation in European Cultural Heritage Institutions 2014 som viser at kulturarvssektoren også på andre relaterte områder står seg godt i en sammenlikning med Europa.

Tilgjengeliggjøring av forskningsdata er et viktig tema også globalt, og spesielt EU har mange aktiviteter som skal støtte opp under bedre tilgang, bruk og deling av forskningsdata. Internasjonal status er ikke kartlagt, men sentrale internasjonale føringer viser en økt satsning på tilgjengeliggjøring av data. Her er noen sentrale aktiviteter på området:

  • EU har vedtatt ambisiøse rådskonklusjoner om åpen forskning

  • Europakommisjonen har besluttet at alle data som genereres gjennom Horisont 2020 skal være åpne som standard

  • EUs planer om en European Open Science Cloud (EOSC).

  • OECD Global Science Forums satsninger på åpne data

I tillegg har Frankrike vedtatt en egen lov om åpen tilgang til forskningsresultater

Data om offentlige utgifter er prioriterte datasett i internasjonale indekser og retningslinjer knyttet til åpne data, som for eksempel EUs Guidelines on recommended standard licence, datasets and charging for the re-use of documents og The International Open Data Charter.

Data om offentlige utgifter er også sentrale indikatorer både i Global Open Data Index og Open Data Barometer. Norge skårer henholdsvis 10 og 5 prosent (av 100 mulige) på disse indeksene på området. Begge indeksene har tilgang til utgiftsdata på transaksjonsnivå som kriterium.

Det er mye aktivitet i Europa knyttet til transportsektoren og høy etterspørsel etter transportdata internasjonalt, spesielt sanntidsdata. The Open Data Barometer er den eneste indeksen som har transportdata som måleindikator, og Norge oppnår her en score på 80% (av 100 mulige) for tilgang til rutetabeller for kollektivtransport.

Status for åpne data i Norge

Tjenesten Data.norge.no, med en nasjonal katalog over åpne data fra det offentlige, ble lansert i 2011. Pr. 31.12.16 er det rundt 6700 individuelle datasett fra 83 statlige og kommunale virksomheter i katalogen. En stor bidragsyter er SSB sin statistikkbank med over 5000 tabeller.

Per i dag er det ingen lovpålagt plikt til å legge data ut for viderebruk. Offentleglova har imidlertid bestemmelser om hvordan offentlige data for viderebruk skal tilgjengeliggjøres.

I 2011 ga regjeringen en fellesføring til alle statlige virksomheter om å åpne opp data, med fokus på datasett som var enkle å gjøre tilgjengelige. Siden den gang har føringer blitt gitt i Digitaliseringsrundskrivet. Digitaliseringsrundskrivet sier at virksomheten skal “gjøre egnet informasjon tilgjengelig i maskinlesbare formater, fortrinnsvis gjennom API’er” og at det skal legges til rette for dette ved etablering av nye eller oppgradering av eksisterende fagsystemet eller digitale tjenester.

I tillegg er det etablert noen virkemidler for å fremme tilgang til (og viderebruk av) offentlige data:

Felles utfordringer og suksessfaktorer

Noen utfordringer og kritiske suksessfaktorer som beskrives av sektorene, er (eller burde være) felles for alle, og felles tiltak kan være hensiktsmessig. En felles forståelse av disse faktorene er uansett viktig. På grunnlag av sektorenes egne beskrivelser av nå-situasjonen peker vi her på noen problemstillinger vi mener er sentrale.

Lite kunnskap om bruk og effekter

Verdier skapes først når data blir tatt i bruk. Etter 5 år med Data.norge.no er nå mange datasett med høy verdi gjort tilgjengelig, og det er behov for å måle effektene. Dette er en fase som mange land er inne i. Kunnskapen om effektene er viktig for å stimulere til mer tilgjengeliggjøring. Manglende kunnskap om effekter kan derfor sees som et hinder for tilgjengeliggjøring.

Åpne data blir som regel publisert åpent, uten krav til å registrere seg for å få tilgang, og det er heller ikke mulig å stille krav til at brukerne må rapportere om hva datasettene blir brukte til. Selv om vi har god oversikt over hvilke datasett som er tilgjengelig, har vi altså begrenset oversikt over hva de brukes til.

Data.norge.no har en katalog over apper og tjenester som bruker åpne data. Brukerne kan selv logge inn og registrere nye oppføringer, og til nå er det nærmere 70 oppføringer i registeret. Vi opplever at det er en viss terskel for å registrere produkter i registeret. Kartverket og Kulturrådet har egne oversikter over applikasjoner og tjenester som bruker henholdsvis kart- og kulturdata.

I tillegg til relativt synlige effekter i form av mobilapplikasjoner og tjenester inngår åpne data også i tjenestekjeder og i eksisterende arbeidsprosesser både i og utenfor offentlig sektor. Eksempler her er vasking av interne register mot enhetsregisteret og bruk av åpne kartdata i fagsystemer. Åpne data fra det offentlige bidrar dermed til mer effektive arbeidsprosessser. Men de samfunnsøkonomiske gevinstene er utfordrende å både synliggjøre og å måle.

Man kan se på statistikk for antall nedlastinger av datasett og på hvor mange spørringer som blir gjort mot maskingrensesnitt (API-er) som leverer ut data, dersom denne informasjonen er tilgjengelig. Ettersom Data.norge.no bare inneholder beskrivelser av data (ikke selve datasettene), er dette informasjon som per i dag ikke samles inn eller benyttes som måleindikator av Difi.

Alle de fem områdene har gjort data tilgjengelig, men vi vet i dag lite om hvilke tjenester og prosesser datasettene inngår i, og hvilke effekter dette gir. En antatt sideeffekt ved økt bruk er at også datakvaliteten forventes å øke som et resultat av flere tilbakemeldinger fra brukerne. Utvikling av gode måleindikatorer for å måle bruk av data og effektene dette gir, er en utfordring som mange land prøver å løse.

Økosystemet - samspillet mellom offentlig og privat sektor

Erkjennelsen av viktigheten av et økosystem og avhengighetsforhold mellom sektorene og deres interessenter er viktig for å lykkes. Et fungerende økosystem er avgjørende for innovasjon, og offentlige virksomheter må også se “eksterne” som viktige dataleverandører. Offentlig sektor må være utadvendt - en kan ikke forvente at aktuelle brukere ser potensialet eller finner dataene uten aktiv formidling fra forvaltningens side. Et godt samspill
og samarbeid om deling, utvikling og innovasjon mellom aktørene i offentlig og privat sektor bør derfor være et uttalt mål i strategier som utformes.

Mobilisering av publikum som produsenter av data – såkalt nettdugnad (crowdsourcing) – representerer et stort potensial for kostnadseffektiv datainnsamling. Sammen med tjenesteytere og brukere kan de etablere effektive «dataøkosystemer».

Det kan være utfordrende for dataforvaltere å vite hva som bør prioriteres først, når det ikke foreligger konkrete forespørsler i markedet. Samtidig er det krevende for potensielle brukere (både internt i offentlig sektor og for næringsliv og sivilsamfunn) å etterspørre data på en konkret måte uten kjennskap til hvilke data offentlig sektor forvalter. Virksomheten bør derfor vedlikeholde og publisere en oversikt over de viktigste dataene de forvalter slik at tilgjengeliggjøring kan prioriteres ut fra brukernes behov.

Flere av sektorene peker på at økosystemet er viktig, og Kart- og eiendomssektoren er spesielt tydelige på dette behovet. De har uttrykt følgende som en av sine hovedmål i høringsutkastet til strategi:

Mål 3: Et velfungerende samspill om forvaltning, deling, utvikling og innovasjon mellom aktørene i offentlig og privat sektor_”
— Alt skjer et sted - Forslag til nasjonal geodatastrategi

De har også målsetninger om å videreutvikle felles arenaer for offentlig-privat samarbeid og å skape aktive miljøer og fellestiltak for innovasjon og FoU. Strategien er også opptatt av mobilisering av publikum som produsenter av data.

Kultursektoren trekker fram behovet for å stimulere til bruk og påpeker at man ikke kan forvente at potensielle brukere ser mulighetene eller finner dataene uten aktiv formidling fra sektorens side.

Det er nødvendig å “pleie” økosystemet for å maksimere verdien av offentlige data og etablere fungerende markedsplasser for åpne data. Selv om sektorene har egne økosystemer, er det trolig store muligheter knyttet til horisontale tiltak ettersom mange innovasjoner trolig vil være basert på flere kilder og data fra ulike sektorer.

Uklarheter rundt anledning til å dele data

En annen utfordring for flere er problemstillinger knyttet til eierskap til data. Når data produseres av flere aktører (ved for eksempel “nettdugnad”, eller når data samles i sentrale løsninger) er det ofte uklarheter rundt hvem som kan dele data eller hvilke aktører det må avklares med. Ettersom det er forskjellige praksis og uklarheter, oppstår det en del paradokser rundt distribusjon av data fra sentrale løsninger. Her er noen eksempler:*)

  • KS leverer ikke ut data fra sitt PAI-register. KS er en interesseorganisasjon og dermed kan heller ikke Offentleglova anvendes for å hente ut data sentralt, selv om akkurat de samme opplysningene er underlagt Offentleglova i hver enkelt kommune. Man må altså be om innsyn fra hver enkelt kommune, istedenfor å få det gjennom et sentralt register. Dette er en lite hensiktsmessig bruk av offentlige ressurser.

  • Direktoratet for økonomistyring (DFØ) leverer regnskapstjenester til en rekke offentlige virksomheter. Offentlige eller private aktører må henvende seg til den virksomheten som eier regnskapsinformasjonen for å få tilgang til data, selv om informasjonen i praksis blir forvaltet i et sentralt system av en offentlig virksomhet.

  • Felles kartdatabase (FKB) er detaljerte kartdata som kommunene leverer via Geovekst-samarbeidet og som blir forvaltet av Kartverket. Selv om en sentralisert løsning finnes, har ikke Kartverket mandat til å distribuere dette som åpne data. På grunn av kommunenes forpliktelser gjennom Geovekst-samarbeidet har heller ikke kommunene anledning til å tilby egne FKB-data som åpne data. Finansiering av FKB-data er blant dilemmaene som omtales i forslaget til ny geodatastrategi.

  • Mange private og ideelle organisasjoner får i oppdrag å samle inn og analysere data på vegne av det offentlige. Disse dataene er svært ofte ikke tilgjengelige som åpne data. Noen ganger er de heller ikke tilgjengelige for oppdragsgiver selv.

  • Ved privatisering av funksjoner og overføring av forvaltningsansvar til stiftelser og virksomheter som er unntatt offentlighet, er det viktig at behovet for tilgang til data ivaretas. Eksempler på data som vi regner som offentlige, men som juridisk sett er/blir unntatt offentlighet som følge av privatisering eller overføring av forvaltningsansvar, er flere.

*) Merk at ikke alle eksemplene er relevante for de fem områdene som er omtalt i Digital Agenda (Kap 14.2.2). De illustrerer likefullt problemstillingen på en god måte.

Behov for kompetanse om deling og bruk av data

For å utnytte mulighetene må brukerne ha kunnskap om hvordan dataene kan utnyttes. Mye av innsatsen har til nå blitt rettet mot å etablere bevissthet rundt deling av data. Dette må utvides til også å omfatte utvikling av kunnskap knyttet til bruk av data. Samtidig bør offentlig sektor i større grad se sin rolle som konsumenter av åpne data fra det offentlige i en stadig mer datadrevet forvaltning, og bygge opp nødvendig kompetanse til å utnytte dette.

Kart- og eiendomssektoren framstår som moden når det gjelder kompetanse på deling av data. De er samtidig tydelige på behovet for kompetansebygging på brukersiden og har satt seg som mål at kompetanse om geografisk informasjon og tilhørende løsninger skal være utbredt:

[Delmål 3.5] Kompetanse om geografisk informasjon og tilhørende løsninger er utbredt Kunnskap om geografisk informasjon og geografiske metoder er nødvendig for full utnyttelse av potensialet og realiseringen av denne strategien […] Det skal utvikles en langsiktig tiltakspakke som bidrar til å tilføre nødvendig kompetanse om bruk og utvikling av brukerløsninger basert på geografisk informasjon – og som kan fremme innovasjon og verdiskapning i samfunnet.
— Alt skjer et sted - Forslag til nasjonal geodatastrategi

Også uformell kompetanseutvikling er viktig. Deler av kultursektoren har jobbet målrettet for å utvikle brukermiljø og kompetanse på brukersiden gjennom workshops, seminar og hackathons.

I transportsektoren er det naturlig å trekke frem Statens vegvesens innsats med å involvere brukerne av Nasjonal vegdatabanks (NVDB) tekniske grensesnitt, mellom annet gjennom bloggen vegdata.no.

Behovet for kompetanse om deling og bruk av data vil bare øke i årene som kommer. Dette gjelder både i offentlig og privat sektor.

Teknologi, infrastruktur og rammeverk

Flere sektorer peker på behovet for å etablere bærekraftige infrastrukturer. Også brukerne etterlyser i økende grad forutsigbarheit og langsiktighet knyttet til tilgang til data. Løsningene som etableres for lagring og distribusjon av data bør derfor være langsiktige.

Her ligger det muligheter for samarbeid på tvers, både på nasjonalt og internasjonalt nivå, og en må stille spørsmål ved om alle fagområder og sektorer har behov for egne infrastrukturer eller om etablering av felles løsninger eller komponenter er hensiktsmessig. Felles spesifikasjoner og standarder blir uansett viktig for å kunne utveksle data og metadata på tvers av sektorer, samtidig som domenespesifikke og internasjonale behov må ivaretas. Difis Fellesoffentlig rammeverk for informasjonsforvaltning er relevant her.

Geonorge er eksempel på en eksisterende infrastruktur som kan være relevant for flere sektorer. Kartdata er ikke et eget område eller en egen sektor, men heller en egenskap ved dataene (de er knyttet til et sted). Deler av forskningssektoren har behov for mange av de løsningene som utvikles og forvaltes i kart- og eiendomssektoren, og et tettere samarbeid bør vurderes nærmere.

Samtidig bør etablerte domenespesifikke infrastrukturer sikres langsiktighet, enten som fellesløsninger eller som løst koblede tjenester basert på størst mulig grad av felles standarder og spesifikasjoner. For eksempel har Kulturrådet lykkes godt med å samle en rekke institusjoner rundt løsningene Norvegiana / Europeana og Kulturnav. Samtidig mangler sentrale nasjonale institusjoner innen kulturfeltet i disse løsningene.

Ulike økosystemer trekker inn mer data fra forskjellige kilder, som vil føre til behov for tettere koblinger mellom infrastrukturer. Brukerne konfronteres i dag med ulike plattformer og fellesløsninger innen beslektede sektorer og fagdomener. For eksempel er det behov for gode koblinger mellom Geonorge og Data.norge.no. En løsning for dette er under utvikling.

I det videre arbeidet med etablering av infrastrukturer for deling og utveksling av data og metadata bør felleskomponenter, løsninger og standarder også på tvers av sektorer etableres der det er hensiktsmessig. Fellesløsninger og teknologi som velges må sikres langsiktighet og understøtte en effektiv oppgaveløsning og åpne for nye bruksmuligheter i samfunnet.

Behovet for felles vokabular og autoriserte registre gjelder for flere sektorer. Entydig referering til informasjon som forvaltes i en annen virksomhet (og i en annen sektor) stiller derfor krav til hvordan autoritetsregistre og kodeverk gjøres tilgjengelig. Behovene oppstår gjerne i andre sektorer og virksomheter enn der informasjonen forvaltes og prioriteringene gjøres. Et eksempel er kultursektorens behov for å knytte informasjon til steder ved hjelp av URI-er i lenkede data-miljøer.

Det er uklart hvilke autoritetsregistre sektorene har behov for, hvilke som skal brukes, hvem som skal ha ansvar for å etablere og/eller ivareta disse registrene over tid, og hvordan de skal gjøres tilgjengelige. Ansvar og funksjoner bør forankres i miljøer og infrastrukturer som kan sikre nødvendig stabilitet og langsiktighet.

Lovverk og politiske føringer

Med en rask teknologiutvikling er det en fare for at lovverk og strukturer ikke er tilpasset de muligheter og behov samfunnet faktisk har. På den annen side kan lov- og regelverk også benyttes mer aktivt for å gi forutsigbare rammer for utviklingen.

Innspillene viser at det er noen utfordringer på lovområdet, og at det kan være behov for å endre lovverk. Hver sektor har spisskompetanse innenfor sitt område, og mye av lovverket er nettopp sektorspesifikt. Et samarbeid på tvers kan likevel være hensiktsmessig for å oppnå felles tilnærming. I noen tilfeller kan løsningen være “myke lover” i form av politiske føringer, retningslinjer, kontrakter og bruk av lisenser.

Konfidensialitet

Hovedregelen er at informasjon offentlige virksomheter behandler, er offentlig. Dette er både grunnlovsfestet og hovedregel i offentleglova, jf. grunnlova § 100, 5. ledd og offentleglova § 3. Målet er blant annet å legge til rette for at offentlig virksomhet er åpen og gjennomsiktig, og legge til rette for viderebruk av offentlig informasjon, jf. offentleglova § 1.

Mange peker på personvern som en særlig problemstilling. Vi har valgt og sette det inn i et bredere perspektiv om konfidensialitet som er forankret i unntaksbestemmelsene i offentleglova kapittel 3 og innebærer mer enn personvern.

Konfidensialitet er viktig, men kun relevant for informasjon som er underlagt lovpålagt taushetsplikt eller er unntatt offentlighet etter offentleglova av andre begrunnede årsaker.

Det er nødvendig å forstå hva konfidensialitet i offentlig sektor handler om, og hva vi skal bruke ressurser på å ivareta og dele. Ellers kan vi bryte både grunnlova og offentleglova og hindre den tilgjengeligheten disse er opptatt av.

Behovet for konfidensialitet gjelder store deler av offentlig sektor og ikke minst de 5 prioriterte sektorene. Det kan være krevende å finne balansen mellom hva som kan publiseres og hva som bør eller skal skjermes, spesielt ved muligheter for sammenstilling med andre datasett. Data må gjerne anonymiseres og aggregeres, eller virksomheten må fremstille egne versjoner som er vasket for konfidensiell informasjon. Dette krever kompetanse, kapasitet, rutiner og verktøy.

Finansiering og insentiver

Finansiering og manglende insentiver for deling er en utfordring i flere sektorer. Egenskapene ved åpne data og datadeling generelt gjør at kostnadene gjerne ligger hos utgiver og effektene hos brukerne, ettersom “samfunnsøkonomisk verdi” ikke kan føres som inntekt i virksomhetenes regnskap. Samtidig er det gevinster også for utgiveren i form av flere tilbakemeldinger ved økt bruk og dermed også økt datakvalitet.

I høringsutkastet til geodatastrategi er det et uttalt mål at større deler av datainnholdet i infrastrukturen blir gjort fritt tilgjengelig og gratis for brukerne. Utfordringen med å gjennomføre det, og samtidig sikre finansiering til forvaltning av detaljerte data er imidlertid ikke løst.

Selv om sektoren har gjort store fremskritt og tilbyr mer gratis data enn noen gang, er det fortsatt en vei å gå på dette området. Dette gjelder spesielt eiendomsdata. Trolig er effekten av avgifter at aktører som alt er etablerte i markedet (og som kan ta kostnadene ved kjøp av data), beholder sin posisjon i markedet på bekostning av små og disruptive aktører. Dette kan i så fall ses som en indikasjon på at markedet ikke fungerer optimalt.

Også forskningssektoren peker på behov for finansiering og insentiver. Mange av de norske infrastrukturene for forskningsdata er bygget opp gjennom kortsiktig/prosjektbasert finansiering fra Norges forskningsråd, og er primært rettet mot selve etablering av arkiv. Finansiering og plan for videre drift med hensyn til kuratering av dataene, standardisering, sikring av gode metadata, tjenester for forskerne osv. oppleves som usikker og uforutsigbar for en del av dem som leder disse infrastrukturene.

Hverken data eller brukere liker skillelinjer

Data i en offentlig virksomhet kan ha stor betydning for berikelse av data i en annen virksomhet. Dette gjelder også på tvers av sektorer. Et opplagt eksempel er kulturdata sammenstilt med kart- og eiendomsdata. Også andre registerdata vil kunne sammenstilles med data fra andre sektorer på måter som vil virke gjensidig berikende.

Det er derfor av betydning at de sektorvise strategiene ikke sementerer sektorvise løsninger på måter som er uheldig for datakvalitet, effektivitet og ikke minst brukerne av data.

Mangelfulle måleindikatorer

Difi måler i dag utviklingen knyttet til tilgjengeliggjøring av åpne offentlige data i antall datasett og antall virksomheter som tilbyr åpne data. Ettersom vi ikke har oversikt over hvilke datasett offentlige virksomheter faktisk forvalter, kan vi heller ikke si så mye om gapet mellom det som er tilgjengeliggjort i dag, og det faktiske potensialet i de fem sektorene.

Selv om indikatorene sier noe om utviklingen knyttet til tilgang til data, sier de ingenting om data faktisk blir brukt og effektene av dette.

Mangelfulle måleindikatorer for tilgjengeliggjøring og bruk av offentlige data, er også et gjennomgående problem internasjonalt. Norges vektlegging av tilgang via sentrale systemer gjennom API-er gjør dessuten at hele datasett-konseptet utfordres. Hvordan man teller datasett i generiske API-er som SSBs statistikkbank, Staten vegvesens nasjonale veidatabank (NVDB) eller Kulturådets Norvegiana-løsning, innebærer skjønn. Antall tilgjengelige datasett kan derfor være en usikker indikator for å si noe om status og utvikling.

Gode måleindikatorer er nødvendig for en bedre nullpunktsmåling av status for de fem sektorene. Difi vurderer nye måleindikatorer på området.

Åpne data i en datadrevet økonomi

Tilgang på åpne data spiller en viktig rolle i en datadrevet økonomi, og det er regjeringens mål at mest mulig av de datasettene som er egnet for viderebruk, er tilgjengelig som åpne data.

Realisering av verdiene vil først bli maksimert når vi har etablert en datadrevet økonomi. Dette er avhengig av en rekke faktorer, og EU-kommisjonen peker på mange av disse i sin dataverdikjede-strategi. Her peker de på nødvendigheten av å

  • stimulere forskning og innovasjon rundt data

  • etablere gode rammeverk

  • ha en gunstig politikk- og lovutforming

  • pleie et helhetlig europeisk økosystem for data

Et velfungerende økosystem for data vil ifølge EU-kommisjonen ha følgende aktører og funksjoner:

  • Et godt samarbeid mellom universiteter / offentlige forskningsinstitusjoner og private partnere om forskning og utvikling.

  • Et tilstrekkelig antall kvalifiserte “data-arbeidere”.

  • En symbiose mellom større bedrifter og små og mellomstore bedrifter (SMB), der SMB-er utfører spesialiserte forsknings- og utviklingsoppgaver, og hvor de større bedriftene støtter oppstart og utvikling av SMB-er ved å gi dem muligheter.

  • En konstant investeringsflyt mot nyetableringer og voksende bedrifter som er aktive innenfor datateknologi og digital tjenesteutvikling.

  • Offentlige organisasjoner som fungerer som "oppstartskunder" for nye datatjenester

  • Stor tilgang på gjenbrukbare og maskinlesbare data som kan være et grunnlag for ny aktivitet og testing, samt et miljø der utviklere deler tilbake sine vaskede og integrerte data for videre bruk.

  • En solid infrastruktur, basert på raskt internett og datalagringstjenester, herunder infrastruktur for å støtte datadrevet forskning og utvikling.

Norge har flere av disse funksjonene på plass, men vi kan trolig gjøre mer for å sette disse bitene sammen til en helhetlig politikk.

EU-kommisjonen peker i sin dataverdikjede-strategi på behovet for en markedsplass der utviklere kan dele sine vaskede og integrerte data. Data.norge.no dekker i dag behovet for å synliggjøre offentlige virksomheters åpne datasett, men det finnes ingen tilsvarende tjeneste for aktører høyere oppe i dataverdikjeden. Kundene i et marked der næringslivet tilbyr bearbeidede offentlige data kan være både privat og offentlig sektor.

Oppsummering

  • På tross av en stadig økning i tilgang på åpne offentlige data, synker Norge på internasjonale indekser. Dette skyldes først og fremst at andre land gjør mer enn oss.

  • Vi vet lite om effektene av økt tilgang til offentlige data i Norge. Dette kan ses som et hinder for mer tilgjengeliggjøring

  • Velfungerende økosystemer rundt offentlige data er viktig for å hente ut gevinster av økt tilgang på data.

  • Vilkår for deling av data er ikke alltid vurdert ved etablering av sentraliserte systemer med data fra flere aktører.

  • Ved privatisering av funksjoner og overføring av forvaltningsansvar til stiftelser og virksomheter som er unntatt offentlighet, må behovet for tilgang til data vi regner som offentlige, ivaretas.

  • Både privat og offentlig sektor har behov for økt kompetanse knytt til bruk av data i årene som kommer.

  • Felles spesifikasjoner og standarder blir viktig for å kunne utveksle data og metadata på tvers av fagområder og sektorer, samtidig som domenespesifikke og internasjonale behov må ivaretas.

  • Det kan være krevende å finne balansen mellom hva som kan publiseres og hva som bør eller skal skjermes. Behovet for konfidensialitet gjelder store deler av offentlig sektor og ikke minst de 5 prioriterte sektorene.

  • Finansiering og manglende insentiver for deling av data er en utfordring i flere sektorer. Utgiftene kommer andre steder enn gevinstene.

  • Innsamling og forvaltning av detaljerte kart- og eiendomsdata finansieres til dels ved hjelp av avgifter. Dilemmaet mellom finansiering og ønsket om gratis data er ikke løst.

  • Data brukes på tvers av sektorer og fagområdet i økende grad. Sektorvise strategier må ikke sementere løsninger som er uheldig for datakvalitet, effektivitet og ikke minst brukerne av data.

  • Vi har i dag mangelfulle indikatorer for å måle status for tilgang til data fra de fem sektorene.

  • Tilgang på åpne data kommer til å spille en større rolle fremover i en stadig mer datadrevet økonomi.

DEL 2: Status for de fem sektorene

Som en del av arbeidet med utvikling av strategier for områdene statlige utgifter, transport, kart- og eiendomsdata, kultur og forskning, har hver sektor utarbeidet beskrivelser av nå-situasjonen. Difi utarbeidet en veiledende mal for dette. Et stort spenn i sektorenes egenart, størrelse og grad av mangfold medfører nødvendigvis også et behov for å beskrive situasjonen på ulike nivå. Malen er derfor blitt brukt i ulik grad. Den sektorvise beskrivelsen av nå-situasjonen er en sammenstilling av innspill vi har mottatt fra de ansvarlige departementene.

Kart og eiendomsdata

Kartverket har flere ulike formidlingskanaler og flere varianter av leveransebetingelser for informasjon som leveres ut.

Formidlingskanaler

De vanligste formidlingskanalene er

  • levering av grunndata via fysiske filer

  • utlevering av informasjon som tjenester

  • ferdige innsynsløsninger (applikasjoner) beregnet på publikum

For tilgang til fysiske filer, som vektor, raster eller som tabellinformasjon benyttes selvbetjente nedlastingsløsninger. Enten via www.geonorge.no for alle data som er gratis eller https://download.geonorge.no/skdl2/nl2prot/nl2 for Norge digitalt parter eller virksomheter med avtale. De mest vanlige utvekslingsformatene er SOSI, GeoJson, FGDB og Shape for vektordata, Geo Tiff og MrSID for rasterdata og PDF for dokumenter.

Et alternativ til fysiske filer er bruk av program-til-program-tjenester. Bruk av slike tjenester er nødvendig i alle sammenhenger der brukeren har behov for oppdatert informasjon. Kartverket leverer i hovedsak tre typer tjenester:

  • Web Map Service (wms) er en tjeneste som leverer kartbilder som er skalerbare og egner seg for visning på PC. Wms benyttes ofte som underlag for annen type tema informasjon. Kartverket har mellom 100 og 130 slike tjenester som viser ulike varianter grunnkart, se oversikt her: http://status.kartverket.no/tjenester/openwms.py. Disse er fritt tilgjengelig for Norge digitalt parter, mens annen bruk har en teknisk begrensning på 300 kartbilder i døgnet.

  • WMS-C Cachetjenester. Cache-tjenestene er basert på WMS-tjenestene, men leverer raskere. Cahce-tjenester baresres på et hurtiglager med pregenererte kartbilder eller fliser (”tiles”) på 256x256 piksler i predefinerte målestokker (zoomnivåer), på tilsvarende måte som f.eks. Google Maps er bygd opp. Dette er de tjenestene som benyttes mest fra Kartverket når det gjelder visning av kart.

  • Web Feature Service (wfs) er en tjeneste som leverer vektorer som mottaker selv kan bearbeide (i motsetning til bildene som leveres fra wms-tjenestene). Opplysninger om eiendomsgrenser fra matrikkelen er et eksempel på en wfs-tjeneste: http://www.test.matrikkel.no/innsynapi_v3/docs/index.html#WFS

  • Web Service (ws) er tjenester på linje med de som er nevnt først, men leverer i utgangspunktet ikke geografiske objekter. Opplysninger fra sentralt stedsnavnregister, matrikkelen og grunnboka er informasjon som leveres ut som ws-tjenester, se f.eks. sentralt stedsnavnregister https://ws.geonorge.no/SKWS52/dok/SSR_sok_v52.html

  • WPS-tjeneste. Kartverket kjører en OGC Web Prosessing tjeneste i eksperimentell drift på http://openwps.statkart.no/skwms1/wps.elevation. Foreløpig tilbyr vi en tjeneste for å hente høyde- og terrenginformasjon. Tjenesten er tilgjengelig gjennom WPS-protokollen.

I tillegg til disse leveres posisjonstjenester fra Geodesidivisjonene, CPOS. Tjenesten består av korreksjonsdata som sendes ut i sanntid ved hjelp av et GSM- eller GPRS-modem på formatene RTCM og CMR+. Med utgangspunkt i mottatte korreksjoner, kan brukerens GPS /GLONASS-mottaker beregne sin posisjon nøyaktig til enhver tid. Tjenesten krever autentisering via brukernavn og passord.

For publikum har Kartverket innsynsløsninger som driftes alene eller sammen med andre. De tre mest besøkte er www.Norgeskart.no, www.seeiendom.no og www.norgeibilder.no , den siste sammen med Skog og landskap og Statens vegvesen. Dette er gratisløsninger som viser den informasjonen Kartverket har på digital form, som ikke er begrenset av lovverket og som egner seg for visning på denne måten.

Leveransebetingelser

For alt som leveres gratis ut benytter Kartverket lisensen CCBY 4.0, se https://creativecommons.org/licenses/by/4.0/

For informasjon som leveres med betalingsbetingelser avtales i utgangspunktet betingelsene for bruk og viderebruk med en lisens basert på disposisjons- og publiseringsrett.

For noen informasjonstyper vil hensynet til nasjonal sikkerhet, for eksempel detaljerte dybdedata i kystnære områder (innenfor 12 nautiske mil), eller hensynet til personvernet, for eksempel deler av Matrikkelen, begrense adgangen til bruk og viderebruk.

Gratis og fri viderebruk (CCBY 4.0)
Tabell 1. Gratis og fri viderebruk av kart- og eiendomsdata

Type

Frigitt

Fysiske filer til nedlasting med format (selvbetjening)

wms

wfs, ws

Norgeskart (NK) Se eiendom (SEE)

Administrative grenser

2013

Sosi, Geojson

Ja

NK, SEE, NIB

Vegdata m/ adresser

2013

Sosi og tabell

Ja

NK, SEE, NIB

N50- N5000 Kartdata Raster og vektor

2013

Sosi, Geojson Geo Tiff, PostGis, MrSid

Ja

NK

Terrengmodeller (10x10 og 50x50)

2013

USGS DEM

Ja

NK

Stedsnavn Norge

2013

SOSI, GeoJson

Ja

NE, SEE, NIB

Illustrasjonskart

2013

GIF, TIFF, AI, PPT

Digital EFS

2014

PDF

Historiske kart sjø

2011

GIF

Wikipedia

Historiske kart land

2014

TIFF

Ja

NK

Maritime geodata

2015

Sosi S57 Shape

Ja

NK

Digital terrengmodell Sjø*)

2015

xyz

Ja

Adresser fra Matrikkel

2015

Csv, Sosi

WfsWs

NK, SEE, NIB

HREF

2015

Xyz

*) innenfor 12 nautiske mil må man søke forsvaret om tilgang og betale en uttakskost. Vegdata m/ adresser omfatter både geometri med vegnavn (Vbase) og vegrestriksjoner + adresser (ELVEG) og forvaltes i samarbeid med Vegvesenet.
Det meste av sjødata ble frigitt i april 2015, med unntak av offisielle sjøkart (POD og ENC).

Informasjon og tjenester mot betaling
Tabell 2. Informasjon og tjenester mot betaling - Kart- og eiendomsdata

Planer om frigivelse

Fysiske filer til nedlasting med format (Selvbetjening)

Begrensninger i tillegg til betaling

Tjenester

Norgeskart (NK) Se eiendom (SEE)

Geotiff, POD (PDF)

Wms (gratis)

NK

Posisjontjenester:

Cpos

RTCM og CMR

Dpos

I løpet av 2017, begrenset til, i første omgang, noen utvalgte for å teste infrastruktur.

RTCM og CMR

Etpos

xyz

Fra PGS

RTCM og CMR

Diverse:

Flybilder (før de blir ortofoto)

Det betales uttakskost i dag

Grunnboken:

Fast eiendom

Ja

wfs, ws

SEE

Borett

Ja

wfs, ws

SEE

Matrikkel:

Data uten personopplysninger

csv

Wms, wfs, ws

SEE

Utlevering etter søknad

csv

Ja

wfs, ws

Detaljerte kartdata:

FKB alle temagrupper

SOSI

Ja

Wms

NK, SEE

SOSI, TIFF

Ja

wms, wfs, ws

NK

GEO TIFF

Ja

wms

NIB

GEO TIFF

Ja

wms

NIB

Sjøinformasjon

ENC (Electronic Navigational Charts) videreformidles via Primar (regionalt koordineringssenter for offisielle elektroniske sjøkart). Øvrig digital informasjon videreformidles via virksomheter med avtale eller på forespørsel direkte fra Kartverkets sjødivisjon. Tilgang til detaljerte maritime geodata er begrenset med hjemmel i lov om forsvarshemmeligheter (innen 12 nautiske mil og detaljnivå 1x1 meter).

Posisjonstjenester

Tilbys enten som data fra det permanente geodetiske nettverket (PGS) i sanntid til virksomheter med avtale eller som korreksjonsdata rett fra Kartverket til sluttbrukerenheten. Signalene formidles på RTCM og CMR+ format via GSM (Mobil) eller internett. Brukere kan inngå abonnementsavtale med Kartverket eller via virksomheter som har avtale med Kartverket. CPOS gir cm nøyaktighet mens DPOS gir brukeren dm nøyaktighet. ETPOS (ettertidsdata) leveres som filer på forespørsel, mens HREF (Høydereferansemodell) leveres på forespørsel eller som en del av abonnementet.

Historiske kart og flybilder

Det er kun en liten andel av flybildene som er digitale, de øvrige digitaliseres og formidles på forespørsel direkte fra Landdivisjonen (uttakskost).

Eiendomsinformasjon

Eiendomsinformasjon utleveres i henhold til tinglysingsloven §§ 12b og 38 og matrikkellova §§ 29, 30 og 32. Den viktigste formelle begrensningen for tilgang og viderebruk er knyttet til hensynet til personvernet.

Opplysninger fra grunnboken og matrikkelen formidles via virksomheter med avtale, eller til offentlig organ som benytter opplysninger som ledd i sin myndighetsutøvelse. Virksomheter betaler enten fastpris pr år, uten rapportering eller benytter tjenestene med pris pr oppslag. Publikum kan gjøre oppslag i matrikkel og grunnbok via www.Seeiendom.no. Det gjelder både innsyn i eiendomsinformasjon og informasjon om heftelser på en eiendom.

Detaljerte kartdata land

Detaljerte kartdata for land er etablert ved hjelp av samfinansiering gjennom GEOVEKST-samarbeidet eller av storkommunene (Oslo, Bærum, Stavanger, Bergen Trondheim). Kartverket videreformidler dataene ved hjelp av virksomheter med avtale, kommunene formidler i tillegg dette selv. Rettigheter til etablerte data, og fremtidig etablering og ajourføring kan bli en utfordring dersom en ønsker å gjøre data billigere eller helt gratis.

For publikum vises dataene gratis i Norgeskart.no og som egne WMS-tjenester.

Transportsektoren

Tre store trender - omstilling til lavutslippssamfunnet, urbanisering og digitalisering - vil prege transportsektoren framover. Dette representerer både utfordringer og muligheter. Flere analytikere oppfatter at transportsektoren er i starten av et teknologisk skifte, en periode med raskere teknologiske endringer og der teknologier som har vært ansett som bærebjelker innen transport på kort tid kan bli skiftet ut. Det vises særlig til biltransport, der de dristigste spår fullstendig utfasing av bensin- og dieselbiler til fordel for batteri¬elektriske biler før 2030, og at selvkjørende biler vil endre persontransport fra å handle om å eie en bil til å være bruker av en transporttjeneste.

Den sistnevnte av de tre trendene – digitalisering – er ikke nytt i transportsektoren, men det kan se ut som om utviklingen er i ferd med å akselerere i en slik grad at transportsektoren om få år kan se svært annerledes ut. I transportsektoren brukes gjerne begrepet ITS (Intelligente Transportsystemer) om økt bruk av IKT i ulike systemer for trafikkstyring, reiseplanlegging, ruteoptimalisering m.m. Stadig billigere sensorer installert i stadig flere typer gjenstander generer sammen med mennesker som "alltid" er koblet til nettet, store mengder data som kan brukes av en rekke ulike aktører, både innenfor og utenfor transportsystemet.

Europeiske initiativ på ITS-området

Datatilfanget i transportsektoren øker voldsomt, samtidig som det vokser fram mange nye og innovative ITS-løsninger og tjenester rettet mot ulike deler av transportsektoren. Samtidig er det en utfordring at ulike ITS-løsninger og applikasjoner ikke "snakker sammen" – innenfor og på tvers av ulike transportformer, på tvers av ulike land, på tvers av administrative grenser innenfor land og på tvers av offentlig og privat virksomhet.

Mot denne bakgrunnen lanserte EU-kommisjonen i 2008 sin Handlingsplan for ITS (ITS Action Plan), samt ITS-direktivet (i 2010) som et juridisk instrument for å understøtte implementeringen av tiltakspunktene i handlingsplanen. ITS-direktivet gir EU-Kommisjonen fullmakt til å vedta bindende spesifikasjoner (i form av EU-forordninger), for ITS-tjenester og applikasjoner som utvikles i Europa, samt for dataene som disse løsningene/applikasjonene bygger på. Poenget med å lage spesifikasjoner/standarder for data/ITS-løsninger/applikasjoner er å sikre at ITS-løsninger og applikasjoner kan fungere sømløst i Europa. Når alle land avgir data på samme mal blir det lettere for privat sektor å lage applikasjoner og løsninger som fungerer grenseoverskridende i Europa.

ITS-direktivet er begrenset til vegsektoren, men med _grenseflater _til andre transportformer. I disse "grenseflatene" finner vi særlig kollektivtransport. I direktivet settes det krav til løsninger, applikasjoner og dataformater på følgende seks områder, som er utpekt som prioriterte tiltak. De konkrete kravene finnes i EU-forordningene som er utarbeidet på alle de seks områdene (pkt. a. er fortsatt under arbeid i EU mens pkt. f. er foreløpig lagt på is av EU-kommisjonen).

  1. innføring av reiseinformasjonstjenester for ulike transportformer på EU-nivå

  2. innføring av sanntids trafikkinformasjonstjenester på EU-nivå

  3. data og framgangsmåter for vederlagsfri framskaffelse av et minimum av generell sikkerhetsrelevant informasjon om trafikken for brukerne, dersom dette er mulig

  4. harmonisert innføring av samvirkende eCall-tjenester på EU-nivå

  5. innføring av informasjonstjenester for sikker parkering av lastebiler og nyttekjøretøyer

  6. innføring av bestillingstjenester for sikker parkering av lastebiler og nyttekjøretøyer

I tillegg til disse tiltakspunktene startet det på forsommeren 2016 også opp et arbeid i EU med å lage spesifikasjoner på feltet C-ITS (cooperative ITS), som omhandler krav til løsninger/applikasjoner/data for kommunikasjon bil-bil og bil-infrastruktur.

Poenget med å lage spesifikasjoner/standarder for data/ITS-løsninger/applikasjoner er å sikre at ITS-løsninger og applikasjoner kan fungere sømløst i Europa. Når alle land avgir data på samme mal blir det lettere for privat sektor å lage applikasjoner og løsninger som fungerer grenseoverskridende i Europa. Norske aktører som genererer data innenfor veg- og kollektivsektoren er pliktige til å følge disse spesifikasjonene (Statens Vegvesen, kollektivselskapene, andre tjenesteytere).

ITS-direktivet gjennomføres i norsk rett gjennom ITS-loven fra 2015. Loven gir Samferdselsdepartementet et hjemmelsgrunnlag dersom det i framtiden skulle være nødvendig å pålegge aktører i transportsystemet å gjøre data tilgjengelig i et spesielt format, eller å sette krav til ITS-løsninger eller applikasjoner.

Flere av ITS-forordningene pålegger norske aktører å gjøre dataene tilgjengelige i et nasjonalt tilgangspunkt (national access point). Tilgang til Statens Vegvesens data kan fås gjennom det nasjonale tilgangspunktet www.data.norge.no

Nå-situasjonen i samferdselssektoren

Vegsektoren

Statens Vegvesen tilgjengeliggjør i dag en rekke viktige datasett. Det er også Statens Vegvesen som har hovedansvar for å følge opp kravene i EU-forordningene avledet av ITS-direktivet, omtalt ovenfor. Disse kravene anses som oppfylt av etaten, og det rapporteres også jevnlig til EU-kommisjonen på dette punktet. Det er Samferdselsdepartementets vurdering at etatens tilrettelegging for viderebruk av offentlige data er relativt god. Interne utfordringer for økt tilgjengeliggjøring av data finnes, men disse jobbes det med. Bl.a. har etaten opprettet en egen gruppe i Vegdirektoratet på tre årsverk som jobber med tilgjengeliggjøring av data for viderebruk.

I vegsektoren opererer også statens nye vegutbyggingsselskap – Nye Veier AS. Selskapet, som er relativt nytt, skal levere data om vegrelatert informasjon til Norsk Vegdatabank (NVDB), som driftes av Statens Vegvesen. Nye Veier leverer også informasjon om eiendommer som erverves til Statens kartverk. Nye veier vil i liten grad lagre egne datasett. Når Nye Veier utvikler datasett og modeller vil disse normalt bli levert til nasjonale registre gjennom kart- og geodatasamarbeid og NVDB.

Kollektivsektoren

Et viktig aspekt i arbeidet med å tilrettelegge for viderebruk av offentlige data i kollektivsektoren handler om å hente inn rutedata og gjøre disse tilgjengelig for reiseplanleggingstjenester. Rutedata, samt annen relevant informasjon som oversikt over stoppesteder og kartdata, er grunnlaget for god reiseplanlegging. Alle kollektivselskap i Norge rapporterer inn sine rutedata til en nasjonale rutedatabasen. Plikten til dette følger av lov. Jernbaneselskapene rapporterer inn sine rutedata på frivillig basis.

Det er en målsetting at det skal være enkelt å benytte seg av kollektivtilbudet i Norge. Det er i denne sammenheng også en målsetting at publikum i fremtiden skal kunne søke frem, bestille og betale en kollektivreise i en og samme operasjon. Stortinget har blant annet bedt regjeringen om å ta initiativ til å opprette en nasjonal ordning med tilbud om elektronisk billett for sømløse kollektivreiser over hele landet.

Arbeidet med å legge til rette for reiseplanlegging og elektronisk billettering har pågått over lengre tid. Statens initiativer er knyttet til å fastsette standarder for kunngjøring av rutedata, å hente inn og gjøre rutedata tilgjengelig for reiseplanleggingstjenester og å etablere en nasjonal og konkurransenøytral reiseplanleggingstjeneste. Staten fastsetter også standarder for elektronisk billettering og sørger for grunnleggende tjenester knyttet til disse standardene.

I første tertial 2017 er det planlagt at statens nye selskap for reiseplanlegging og billettering, Entur AS, skal skilles ut fra NSB og eies direkte av Samferdselsdepartementet. Selskapet vil ha ansvar for å tilby en nasjonal, nøytral reiseplanlegger for all kollektiv, en salgskanal for billetter på tvers av togselskap og kollektivselskap i første omgang der det finnes takstsamarbeidsavtaler i dag, samt ha ansvar for en rekke databaser og baksystemer for reiseplanlegging og billettering.

Jernbaneverket (oppgaven flyttes til Bane NOR SF fra 1.1.2017) har ansvar for ruteinformasjon og ruteplandata for jernbanen. Denne informasjonen samles i systemet Kari og alle som er registrert på Jernbaneverkets server kan få tilgang. I tillegg offentliggjør Jernbaneverket punktlighetsstatistikk på sine nettsider i excel-format.

Statens jernbanetilsyn har per i dag ingen data tilgjengeliggjort for viderebruk og tilsynet har heller ikke registrert noen etterspørsel etter deres data. Tilsynet forvalter et vognregister for jernbanemateriell som er felles for alle medlemsland i EU. Tilsynet utvikler for tiden nye registerløsninger for fagområdene taubane og fornøyelsesinnretninger og vil i samarbeid med bl.a. bransjeorganisasjonene vurdere behov for tilgjengeliggjøring av disse datasettene.

Sjø

I henhold til Kystverket har det skjedd en enorm utvikling av nye tjenester basert på deling av offentlige data og informasjon, med stor betydning for Kystverkets samarbeidspartnere og profesjonelle brukere. De store driverne for utviklingen er Kystverkets kunder/brukere. Behovet for bedre og nye tjenester, at offentlige data har stor nytte for profesjonelle brukere til sjøs og for næringen, samt for samarbeidende myndigheter, er det som driver utviklingen videre. Norske myndigheter har de siste årene fått tilgang til helt nye verdensledende verktøy innen overvåkning og myndighetsutøvelse i kyst- og havområdene våre.

Ifølge Kystverket er kystsektoren i Norge i tet på tilgjengeliggjøring og deling og kobling av offentlige data og informasjon, både internt i Norge, men også med andre land. Særlig gjelder dette samarbeidet i Europa innen skipsrapportering og AIS (Automatisk Informasjonssystem). Det vises også til samarbeidet mellom 30 etater i BarentsWatch-samarbeidet, hvor formålet nettopp er å dele, koble og tilgjengeliggjøre offentlige data knyttet til hav og kyst med fokus på nordområde. Her skapes helt nye tjenester for profesjonelle brukere til sjø og for myndighetene.

I sektoren er datasett tilgjengelige gjennom egne API-er og gjennom portaler som geonorge.no, nedlasting.kystverket.no, barentswatch.no og data.norge.no.

Luftfart

Avinor har ikke enda svart på oppdragsbrev om kartlegging av nåsituasjonen m.h.t. tilrettelegging for viderebruk av offentlige data. Samferdselsdepartementet må derfor få komme tilbake med mer informasjon om status i denne sektoren senere.

Luftfartstilsynet gjør data tilgjengelig på sine nettsider. Eksempler på tilgjengelige data er oversikt over norskregistrerte luftfartøy, kontrollanter, flyleger og UH-informasjon. Problemstillinger knyttet til globalisering av luftfart har medført noe større etterspørsel etter data, med etterspørselen har så lavt volum at Luftfartstilsynet ikke anser det som ressursøkonomisk å etablere tjenester der dataene kan hentes ut via API’er e.l. Imidlertid har Luftfartstilsynet i sitt Målbildet 2018+ som delmål å levere enda bedre tjenester til eksterne brukere. I den pågående omorganiseringen i Luftfartstilsynet er også brukernes behov en viktig dimensjon. Deling av offentlige data er et tema som kan gå inn i dette arbeidet, samt tilsynets arbeid med å oppdatere sin digitaliseringsstrategi, et arbeid som vil skje i 2017.

Ekomsektoren

Nasjonal kommunikasjonsmyndighet har lagt ut en rekke datasett på data.norge.no I tillegg er det laget en oversikt over data på Nkoms eget nettsted Nkom.no. Det er Nkoms inntrykk at dataene brukes aktivt, særlig som bakgrunn av analyser gjort i meglerhus og blant bransjeaktører, forbrukermyndigheter og media.

Etaten har ikke statistikk for hvilke åpne data som blir mest brukt, men erfarer at tall fra ekommarkedene (mobil, bredbånd, osv.) er svært mye brukt. Etaten forventer den samme utviklingen framover, men også en økning i tall over kapasitetsmåling for mobil/bredbånd, som lagres av brukerne selv påhttp://www.nettfart.no/[ www.nettfart.no].

Annet

Statens Havarikommisjon er del av transportsektoren, om enn noe på siden, som en faglig uavhengig og svært spesialisert etat. Etaten produserer rapporter fra ulykker og hendelser, og har ellers ikke registerdata eller fagsystemer av noe slag. Etaten opplever i økende grad en forventning om å være bidragsyter i europeiske databaser for ulykker eller ulykkesundersøkelser, for eksempel European Marine Casualty Information Platform (EMCIP), European Railway Agency Database for Interoperability and Safety (ERADIS) og Safety Recommendatio Information System (SRIS). Dataene blir da registrert direkte i de europeiske databasene og etaten har ikke noen lokal variant av tilsvarende databaser.
Statens Havarikommisjon har et avgrenset mandat og informasjonen som forvaltes er i stor grad underlagt taushetsplikt. Resultatene som offentliggjøres er i form av offentlige rapporter, i henhold til kommisjonens mandat.

Sentrale problemstillinger framover hva gjelder data i transportsektoren

Samvirkende ITS

Mange ITS-løsninger og applikasjoner er relativt transportformspesifikke eller etatsspesifikke. Imidlertid er det slik at de kanskje største gevinstene av ITS og digitalisering i transportsektoren kan tas ut når en begynner å koble applikasjoner, løsninger og systemer sammen på tvers av transportformene. Et begrep for slik sammenkobling er Samvirkende ITS. Ved samvirkende ITS utnyttes kommunikasjon mellom kjøretøy, trafikanter, og infrastruktur for å oppnå bedre framkommelighet, økt trafikksikkerhet og mer miljøvennlig mobilitet. Samvirkende ITS muliggjør deling av informasjon om kjøretøyers plassering, bevegelse og andre data fra mobiltelefoner og kjøretøy. Dette kan gi bedre mobilitetstjenester for alle trafikanter. Slike løsninger åpner for avansert styring av trafikken og helt nye muligheter som kan bidrar til bedre trafikksikkerhet og miljø. I dag arbeider myndigheter, bilindustri, standardiseringsorganer, teknologi- og tjenesteleverandører tett sammen for å realisere mulighetene som ligger i Samvirkende ITS systemer.

Det er særlig i byer at samvirkende ITS har et potensial til å bidra til å nå mål om mer effektiv bruk av eksisterende fysisk infrastruktur, bedre trafikkflyt og større overgang av reisende fra bil til kollektiv/sykkel eller gange, understøttet av bedre og mer personaliserte tjenester fra mobilitetsleverandører, tilgjengeliggjort for trafikanter gjennom mobiltelefonene deres.

Samvirkende ITS kan gi en ytterligere vekst i mengden data generert i transportsektoren

Bak løsninger som f eks. reiseplanleggere, billetteringsløsninger og applikasjonsbaserte samkjøringsløsninger ligger det store mengder data, skaffet vil veie av ulike aktører i transportsystemet. I framtiden er det ventet at trafikantene selv vil generere ytterligere data om sin egen reiseadferd, enten som reisende med kollektivsystemene, eller som førere av en bil. I førstnevnte tilfelle snakker vi om utvikling av den type Ruter har gjennomført gjennom sitt pilotprosjekt på 60-bussen, hvor de reisende avgir eksakt informasjon om sin reiseadferd gjennom beaconssignaler (nettvarder) når de går på og av bussen. Denne informasjonen kan f eks. brukes av Ruter til betalingsoppgjør (dette har potensial til å spare selskapet for betydelige utgifter til reisekort og automater), eller andre type tjenester, f eks. at Ruter kan bruke dataene til å gi den reisende en bedre tjeneste i form av varslinger på telefonen om forsinkelser, råd om å gå tidligere hjemmefra eller ta sykkel den aktuelle dagen pga. signalfeil i t-banenettet, forslag til alternative reiseruter m.m. – alt basert på hva Ruter vet om din tidligere reiseadferd. Kollektivselskap kan også bruke denne type data til å forbedre ruteplanleggingen sin m.m. En lignende type kilde til data er teledata fra Telekomselskapene. Ut fra signaler om mobiltelefonens oppkobling langs reisen kan man måle reisemønstre på et aggregert nivå. Denne type data kan igjen brukes av en rekke ulike aktører som f eks. til planleggingsformål, som grunnlag for forskning m.m.

På samme måte som kollektivreisende kan avgi informasjon om sin reiseadferd vil også bilister kunne gi informasjon om sin. Når alle biler etter hvert blir "connected" vil alle bilers bevegelser i trafikken bli logget, og det vil her bli snakk om store mengder data. Dette åpner igjen for en hel rekke muligheter og tjenesteområder, fra informasjon om rutevalg og reisetider (som allerede i dag tilbys fra f eks. Google Maps, som baserer sin informasjon på signaler de reisende avgir når de har slått på stedsangivelsen i mobilapp’en Google Maps), til ulike typer digitalisert trafikkstyring i byer. I tillegg til spørsmål om ren tilrettelegging for viderebruk av offentlige data, vil Samferdselsdepartementet og underliggende virksomheter her møte på problemstillinger av nyere karakter, bl.a. knyttet til muligheter som ligger i stordata (big data) og muligheter for utnyttelse av data fra private selskap, som vil kunne ha stor nytteverdi for samferdselsmyndighetene.

Et nyere trekk ved samferdselssektoren i dag er en relativt kraftfull inntreden i sektoren av nye aktører som tidligere ikke har spilt en sentral rolle i transportmarkedet, eksempelvis tilbys flere trafikkstyringsløsninger til trafikanter. I framtiden er det ikke utenkelig at slike løsninger blir svært utbredt og det er også da sannsynlig at samferdselsmyndighetene etter hvert må forholde seg til denne utviklingen på en annen måte enn tidligere. Denne utviklingen kan reise nye problemstillinger rundt grensedragningen mellom offentlig og privat sektor om eksempelvis trafikkstyring. Et sentralt spørsmål hva gjelder data i framtidens transportsektor handler derfor ikke bare om å tilrettelegge for viderebruk av offentlige data, men også om hvordan offentlig sektor kan nyttiggjøre seg av data samlet inn av privat sektor.

Cybersecurity og IKT-sikkerhet

I framtidens digitaliserte transportsystemer vil det bli viktig å sikre seg at mot at lokale systemer i kjøretøyer eller sentrale styringssystemer kan påvirkes av andre (hacking, sabotasje med mer). En ting er at enkeltkjøretøyer kan komme ut for ulykker, men for eksempel falske vegmeldinger vil også lett kunne skape kaos og lede trafikanter inn i farlige situasjoner. Samtidig som internett og nye tjenester skaper store muligheter for utvikling og vekst, viser de åpne trusselvurderingene fra E-tjenesten, PST og NSM at digitaliseringen av samfunnet og økt internasjonalisering skaper nye arenaer for kriminelle handlinger med sikte på økonomisk vinning, spionasje og sabotasje. Ekomnettene og transportsystemer kan både være en bærer av kriminelle handlinger i cyberdomenet eller være mål i seg selv, enten hensikten er spio­nasje eller å ramme kritiske samfunnsfunksjoner.

Også IKT-sikkerhet bør være et satsingsområde i framtidens digitaliserte transportsystemer. NOU 2015:13 Digital sårbarhet – sikkert samfunn (Lysneutvalget) påpeker at IKT-sikkerhet i transportsystemet ikke er avgrenset til å sikre ekomnett- og tjenester. Transportsystemet i sin helhet består av flere komponenter eller delsystemer, som omfatter alt fra selve infrastrukturen, via signal- og styringssystemer, til transportmidlene og deres systemer. Den digitale utviklingen kjennetegnes av økende integrasjon mellom disse systemene og dertil økende kompleksitet. Det sentrale i denne sammenheng er at alle disse delsystemene kan ha sine egne digitale sårbarheter som kan svikte eller utnyttes.

Personvern

I framtiden vil samferdselsmyndigheter i større grad vil stå ovenfor utfordringen med at jo flere datakilder som kobles sammen og dermed kan gi store trafikale gevinster, jo større er utfordringene knyttet til ivaretakelse av personvernet. Det er naturlig at samferdselsmyndighetene vil måtte vie mer tid til spørsmål knyttet til personvern etter hvert som utviklingen innen ITS og digitalisering går framover.

Statlige utgifter

Status for tilgjengeliggjøring

Statlige utgifter kan studeres ut fra budsjett- eller regnskapsperspektiv. Statsbudsjettet angir hvor mye utgifter og inntekter staten planlegger å bruke/motta i budsjettåret, fordelt på departement, programområder, kapitler og poster. Statsbudsjettet settes opp og behandles i samsvar med Stortingets bevilgningsreglement. Kapitlene i statsbudsjettet kan omfatte en eller flere virksomheter. Det er det enkelte departements ansvar å stille budsjettet til disposisjon for virksomhetene, herunder fordele budsjettet på virksomheter når et kapittel omfatter flere virksomheter. Dette skjer i etatsstyringen, og fordelingen framgår ikke av statsbudsjettet.

Statsbudsjettet publiseres når regjeringens forslag legges fram for Stortinget i begynnelsen av oktober hvert år før det aktuelle budsjettåret. Revidert statsbudsjett legges fram i mai og nysaldert budsjett i november i budsjettåret. De to revisjonsrundene viser endringstall i forhold til saldert budsjett (vedtatt budsjett i Stortinget desember før budsjettåret). Informasjon om datasettene og selve tallmaterialet er tilgjengelig i åpne data format (csv) på www.statsbudsjettet.no. Tallene bak figurene er tilgjengelig i både html og excel-format.

Finansdepartementet har i en årrekke gjort alle tall som publiseres i budsjettdokumenter offentlig tilgjengelige i maskinlesbar form. Departementet publiserer nå flere tall enn før, bl.a. for strukturell balanse. Bakgrunnen for dette er etterspørsel etter tallene, bl.a. bruker mange budsjettfigurer i egne presentasjoner. Med internett ble det lettere tilgang til disse dataene for brukerne, og mindre arbeid for departementet ved innsynsbegjæringer. Åpenheten har også en egenverdi ved at det styrker troverdighet og omdømme. Alle budsjettdokumentene publiseres også på nettet, som pdf, epub, rtf og som html.

Statsregnskapet omfatter faktiske utgifter og inntekter på de samme kapitlene og postene som i statsbudsjettet, og viser i tillegg utgifter og inntekter på artskonti og virksomheter for de bruttobudsjetterte virksomhetene. Dette gjelder aggregerte tall, dvs. sum utgifter og inntekter per kapittel/post og per tresiffernivå på artskonto. Hver måned blir det publisert rapporter fra statens bevilgningsregnskap på DFØs nettsider, der det også finnes informasjon om datasettene. Statens utgifter og inntekter presenteres i rapportene slik de stilles opp i den årlige meldingen om statsregnskapet (Meld. St. 3) til Stortinget. Et rådatauttrekk, som også inneholder regnskapsdata på artskonti etter standard kontoplan, er i tillegg lagt ut i excel-format under Norsk lisens for offentlige data (NLOD).

DFØ publiserer hver måned oppdatert bevilgningsregnskap per kapittel og post med oversikt over samlet bevilgning (inkl. overføring fra i fjor og årsbudsjett), regnskap hittil i år og avvik for (1) statens utgifter, og (2) statens inntekter, samt oversikt over (3) bevilgningshistorikk som viser overført bevilgning fra i fjor, saldert budsjett og endringer med henvisning til proposisjon/innstilling. Det publiseres i tillegg et eget dokument (4) med lenker til alle proposisjoner/innstillinger med budsjettrelevans og som ligger til grunn for bevilgningsvedtakene på kapittel og post i statsbudsjettet.

Statlige virksomheter publiserer hvert år innen 1. mai en årsrapport fra virksomheten, jf. Bestemmelser om økonomistyring i staten, kap. 1.5.1 og 2.3.3 Årsrapporten inkluderer årsregnskapet. Det er ikke krav om at årsrapporten og årsregnskapet skal publiseres i åpent data-format. Årsrapporten skal gi et dekkende bilde av virksomhetens resultater og gi departementet grunnlag for å vurdere måloppnåelse og ressursbruk. Hensikten er bedre kvalitet, mer åpenhet og mindre omfattende rapportering.

Alle data som publiseres kan gjenbrukes uten gebyr.

Status for bruk av data

Fagdepartementene mottar hver måned faste rapporter med regnskapstall fra statsregnskapet som gir grunnlag for budsjettoppfølging og regnskapsanalyse, og rådatafiler i excel-format med informasjon om standard kontoplan per virksomhet.

Departementene bruker data fra statsregnskapet til oppfølging, budsjettkontroll, regnskapsanalyse, sammenligning og prognosearbeid, og i mindre grad til budsjettering og styring. Informasjon om utgifts- og inntektsarter er også nyttig for departementene for å få bedre kjennskap til utgiftsstrukturen i virksomhetene og innenfor budsjettkapitler.

Finansdepartementet får i tillegg noen spesialrapporter, blant annet «REGBASE»-uttrekk og returfil med regnskapstall til BUDSYS. Der det er aktuelt, er disse rapportene utvidet til også å vise artskonto.

Riksrevisjonen får også hver måned tall fra statsregnskapet. Dette gjøres i et program utviklet av Riksrevisjonen selv. I årsoppgjøret utvides datainnholdet i rapportene.

Statistisk sentralbyrå får også månedlige leveranser. På forespørsel leveres i tillegg spesialuttrekk av artskonto. SSB får også ekstrarapportering til årsoppgjøret hvor kapitalregnskapet er inkludert.

DIFI har på konkrete henvendelser fått oppstillinger, gjerne gruppert etter standard kontoplan. For eksempel på utgiftsgrupper som IT, konsulentbruk osv. Difi har etablert en statistikkdatabase med publiseringsløsning for offentlige anskaffelser som blant annet er basert på data fra statsregnskapet.

Representanter fra media har gitt klart uttrykk for at rådata (big data) bør være tilgjengelig for eksterne interessenter som media, forskere, osv. Rådata er viktig for gravende journalister, men det er ikke noen motsetning mellom publisering av rådata og enklere tilrettelegging av data til analyse og sammenligning f.eks. i enkle rapporter og presentasjoner.

KD innhenter tallmateriale fra samtlige nettobudsjetterte virksomheter i sektoren og aggregerer og avstemmer dette internt. KD nytter DBH-databasen som hjelpemiddel i forbindelse med aggregeringen.

Utviklingstrekk med hensyn til tilgjengeliggjøring

Tabell 3. Utviklingstrekk med hensyn til tilgjengeliggjøring - statlige utgifter
Tid Tiltak

2001

Nasjonalbudsjettet 2002 ble lagt frem med eget (digitalt) excel-vedlegg for tallene bak hvert diagram i dokumentet, slik at brukerne selv kunne laste ned tallsettene.

2010

Statsbudsjettet 2011 blir lagt frem på nettet med egen tabellgenerator som gjør uttrekk i excel og .csv for alle tabellene som er brukt. Senere blir dette omgjort til å være kun .csv-filer.

2010

DFØ publiserer hver måned (pdf) oppdatert bevilgningsregnskap per kapittel og post, bevilgningshistorikk og lenke til proposisjoner/innstillinger med budsjettrelevans. Finansdepartementet innhentet synspunkter fra alle departementene i forkant av innføring av denne ordningen.

2010

FIN innfører obligatorisk standard kontoplan, som legger til rette for standardisering av årsregnskap og rapportering av mer detaljerte regnskapsdata til statsregnskapet.

2013

Statsbudsjettet 2014 blir lagt frem med både .epub og rtf-format i tillegg til pdf og html av samtlige budsjettdokumenter.

2013

FIN endrer økonomiregelverket med nye krav til årsrapport og årsregnskap for statlige virksomheter med virkning fra og med rapporteringen for 2014. Årsrapporten skal settes opp etter en felles mal og gi et dekkende bilde av virksomhetens resultater. Årsrapporter skal publiseres på virksomhetens og departementets nettsider, første gang 2015. Departementene skal også publisere tildelingsbrevene på sine nettsider.

2014

Finansdepartementet uttrykte i Gul bok 2015, kap. 7.4:

2015

DFØs statsregnskapsrapporter (kapittel/post) publiseres i excel-format. I tillegg legges det ut rådatafiler i excel-format med data etter standard kontoplan per virksomhet. Finansdepartementet innhentet synspunkter fra alle departementene i forkant av denne utvidelsen av publiseringsomfanget.

2015

DFØ starter på oppdrag fra Finansdepartementet et publiseringsprosjekt for å forenkle og forbedre tilgangen til regnskapsinformasjon både internt i statsforvaltningen og for

2016

DFØ fremmer forslag på oppdrag fra FIN om en standardisert definisjon og offentlig oversikt over statlige virksomheter. Dette vil forenkle og legge bedre til rette for publisering av nøkkeldata og sammenligning på tvers i staten.

2016

DFØ fremmer forslag på oppdrag fra FIN om en løsning for innrapportering av regnskapsdata fra nettobudsjetterte virksomheter i staten. Dette vil komplettere rapporteringen av regnskapsdata for alle virksomhetene i staten.

2016

Finansdepartementet gjennomfører et forprosjekt for å tilrettelegge en database for benchmarking av administrasjonskostnader i statlige virksomheter, og publisere parametere og nøkkeltall om administrative kostnader.

2017

Løsningen for publisering av informasjon fra statsregnskapet på nett – som vil gjøre mer data bedre tilgjengelig for flere brukere - lanseres i løpet av 2017.

SSB publiserte i noen år data om statlig ressursbruk og resultater (Statres) for en rekke statlige virksomheter (etater). Statres ble brukt i liten grad. De enkelte virksomhetene har allerede raskere tilgang på resultatinformasjonen, i og med at de i stor grad er kilde for denne informasjonen. Virksomhetene kjente seg ofte ikke igjen i ressursdata fordi SSB omregner regnskapsdata til nasjonalregnskapsdefinisjoner. Statres ble derfor lagt ned i 2015.

Andre land som det er naturlig å sammenligne med, publiserer mer offentlig regnskapsinformasjon enn det vi gjør i Norge. I forarbeidene til publiseringsløsningen for statsregnskapet vurderte arbeidsgruppen særlig eksempler fra Storbritannia, Danmark og Sverige.

Det har de seneste årene blitt betydelig økt internasjonal oppmerksomhet omkring tilgjengelige åpne offentlige data. Open Government Partnership-bevegelsen har bidratt til dette. Både OECD, IMF og International Budget Partnership (IBP) har utviklet indekser for å vurdere og rangere land mht. åpenhet knyttet til offentlige budsjetter og regnskapsdata The Open Budget Index 2015 (IBP) vurderer Norge på fjerdeplass. Andre internasjonale organisasjoner har videreutviklet indekser som vurderer om tilgjengelige offentlige data er på et åpent dataformat. Open Knowledges indeks The Global Open Data Index 2015 vurderer Norge foreløpig på åttendeplass, mens Worls Wide Web Foundations indeks Open Data Barometer 2015 setter Norge på en syttendeplass. Den sistnevnte indeksen vurderer offentlige regnskapsdata om lag på samme måte som den første, men Open Data Barometer vurderer flere sektorer i samfunnet, både offentlig sektor, næringsliv og privat/sivilt samfunn, og har tre dimensjoner: tilgang, bruk og effekt. Det er et hovedinntrykk at de sistnevnte indeksene for åpne data inkluderer detaljerte transaksjonsbaserte data når det vurderes tilgjengelighet av regnskapsdata. Her skårer Norge svakt, sammen med de fleste andre land. En del land publiserer imidlertid offentlige innkjøp over en viss verdi (enkelttransaksjoner).

Forskning

Pågående aktiviteter

Kunnskapsdepartementet (KD) har bedt Forskningsrådet om å bistå i arbeidet med å utarbeide en nasjonal strategi for tilgjengeliggjøring av forskningsdata. I januar 2017 leverte Forskningsrådet et kunnskapsgrunnlag som inneholdt;

  • En kortfattet gjennomgang av relevante pågående prosesser nasjonalt og internasjonalt (primært i EU) knyttet til tilgjengeliggjøring av forskningsdata, herunder litt om hvorfor tilgjengeligjøring av forskningsdata har kommet på den politiske agendaen.

  • En samlet oversikt over datainfrastrukturer som hittil har fått finansiering fra Forskningsrådet, primært fra Nasjonal satsing på forskningsinfrastruktur (ca. 1 milliard kr i samlet kontraktssum hittil).

  • En oversikt over viktige nasjonale tjenester for håndtering av forskningsdata og forvaltningsdata av interesse for forskning

  • En gjennomgang av ulike finansieringsmodeller for datainfrastrukturer.

  • En gjennomgang av identifiserte behov identifisert gjennom samtaler og dialogmøter med nasjonale leverandører av tjenester for lagring og tilgjengeliggjøring av data og UH-sektoren.

  • En kortfattet drøfting av behov og mulige løsninger, samt innspill (se nedenfor).

Kartleggingen Forskningsrådet foretok viser at det finnes en del barrierer for å få tilgang til data fra de datainfrastrukturer som i dag finnes/etableres. Dette gjelder både forsknings- og forvaltningsdata. De viktigste barrierene er:

  • Manglende felles standarder for data og metadata kan gjøre gjenbruk av forsknings- og forvaltningsdata vanskelig.

  • Flere forskningsinstitusjoner er restriktive med å tilgjengeliggjøre egne data for gjenbruk.

  • Uthenting av data fra datainfrastrukturer eller registre der kostnadene for tilgang belastes forskningsprosjekter, har ofte manglende forutsigbarhet hva angår kostnader og tiden det tar.

  • For helse og persondata er det mange ulike aktører som igjen er underlagt ulike forskrifter og formål, og hvor komplekse og strenge utleveringsbetingelser vanskeliggjør gjenbruk av data. Kunnskapsgrunnlaget avdekker vesentlige strukturelle, tekniske og økonomiske behov som bør adresseres for å oppnå sikrere lagring og bedre tilgang til forskningsdata og forvaltningsdata for forskning. Noen av de viktigste behovene aktørene har løftet fram er:

  • Strengere krav om deling av forskningsdata og om datahåndteringsplaner i forskningsprosjekter

  • Institusjonelle policyer for datahåndtering

  • Samordning av nasjonale tjenester og aktører

  • Utvikling og innføring av internasjonalt omforente standarder for datahåndtering

  • Opplæring og kulturendring blant forskere og studenter

  • Insentiver for lagring og tilgjengeliggjøring av datasett

  • Langsiktighet og forutsigbarhet ved finansiering av datainfrastruktur

  • Bevaring og tilgjengeliggjøring av allerede innsamlede datasett slik at disse kan gjenbrukes

I kunnskapsgrunnlaget gir Forskningsrådet følgende innspill til det videre arbeidet for økt tilgjengeliggjøring av forskningsdata:

  • Forskningsinstitusjonene bør i samarbeid med egne forskere lage retningslinjer for hvilke data som skal lagres, kurateres og tilgjengeliggjøres ved egen institusjon.

  • Forskningsrådet og andre som bidrar med offentlige midler til FoU bør vurdere å kreve en datahåndteringsplan for prosjekter som genererer forskningsdata.

  • Kunnskapsdepartementet bør vurdere å etablere et "forskningsdataforum" for samordning og videreutvikling av nasjonale løsninger for lagring, analyse og tilgjengeliggjøring av forskningsdata.

  • Forskningsinstitusjonene bør vurdere å etablere felles kommunikasjonsarenaer hvor de kan diskutere fagspesifikke standarder som muliggjør deling og gjenbruk av data.

  • Forskningsinstitusjonene bør vurdere å utvikle én felles, nasjonal tjeneste for sikker analyse og kortidslagring av sensitive forskningsdata.

  • Institusjonene bør vurdere å legge bedre til rette for opplæring i datahåndtering og gjenbruk av data.

  • Kunnskapsdepartementet bør vurdere å utrede insentiver for tilgjengeliggjøring av forskningsdata.

  • Institusjoner med ansvar for datainfrastrukturer bør etablere langsiktige driftsfinansieringsmodeller.

  • Forskningsrådet bør vurdere å utarbeide kriterier for hvordan Nasjonal satsing på forsknings-infrastruktur i spesielle tilfeller skal kunne bidra til grunnfinansiering av drift av datainfrastrukturer.

  • Kunnskapsdepartementet, i samarbeid med relevante fagdepartementer, bør vurdere å utrede mulighetene for en strukturell finansiering som kan dekke kostnader til å gi forskerne innsyn i hvilke forvaltningsdata som finnes og avklare om forskningsprosjektet kan få tilgang til nødvendige data.

  • KD bør vurdere å opprette en arbeidsgruppe med representanter fra sentrale forskningsinstitusjoner som kan utfylle eksisterende kunnskapsgrunnlag.

KD påbegynt det tverrdepartementale arbeidet med en strategi for tilgang til data i januar 2017.

Andre norske aktiviteter som er relevant for tilgjengeliggjøring av forskningsdata:

  • KD mottok forslag til nasjonale retningslinjer for åpen tilgang til forskningsresultater fra arbeidsgruppe 14. juni. Forslaget har vært på høring, fristen var 1. november. Current Research Information System in Norway (CRIStin) bistår i oppsummeringen av høringssvarene og vil arrangere en konferanse om aktuelle problemstillinger i januar 2017.

  • Helse- og omsorgsdepartementet (HOD) ferdigstilte sin internrapport om Nasjonal helseregisterstrategi – status, utfordringer og veien videre 30. august.

  • Agenda Kaupang leverer sin rapport til Forskningsrådet (NFR) om "Persondata til helseforskning" 15. desember 2016 (hovedtrekk ble gjort kjent på et arrangement 8. november).

  • Arbeidsgruppen for IKT-strategi og helhetlige løsninger i UH leverte første delrapport til KD 29. juni og vil levere endelig rapport med forslag til IKT-strategi for UH-sektoren i november-desember. Spørsmålet om IKT-organisering utgjør en viktig komponent i oppfølgingen av rapporten fra Gjedrem og Fagernæs, "Kunnskapssektoren sett utenfra" (jan. 2016), om organisering av kunnskapssektoren.

  • HOD mottar rapporten fra ekspertutvalget som skal utrede enklere tilgang og bedre utnyttelse av helsedata 30. juni 2017.

  • Norge har formannskapet i Nordisk ministerråd i 2017. Åpen forskning vil være et prioritert felt i det norske formannskapet.

  • FIN har nedsatt et utvalg som skal vurdere statistikkloven og Statistisk sentralbyrås virksomhet. Utvalget skal levere sin rapport innen 15. desember 2017. https://www.regjeringen.no/no/aktuelt/dep/fin/pressemeldinger/2016/utvalg-skal-vurdere-statistikkloven/mandat-for-statistikklovutvalget/id2510801/

  • EUs nye personvernforordning skal implementeres i Norge våren 2018. JD leder arbeidsgruppen der også KD deltar.

Tilgjengeliggjøring av forskningsdata er et viktig tema også globalt, og spesielt EU har mange aktiviteter som skal støtte opp under bedre tilgang, bruk og deling av forskningsdata. Noen sentrale, pågående aktiviteter:

  • EU vedtok ambisiøse rådskonklusjoner om åpen forskning 27. mai 2016. Punkter på European Research Area Roadmap om tilgang til kunnskap skal følges opp (http://ec.europa.eu/research/era/optimal-circulation_en.htm), jf. vårt nasjonale veikart prioritering 5 A og B https://www.regjeringen.no/contentassets/1b619466970f4e9b98b3d639b78cd200/era-national-action-plans-2016---2020---norway.pdf

  • Europakommisjonen har besluttet at alle data som genereres gjennom forsknings- og innovasjonsprogrammet Horisont 2020 skal være åpne som standard (as open as possible, as closed as necessary). Dette var en del av European Cloud Initiative, presentert 19. april 2016.

  • Som en del av European Cloud Initiative presenterte kommisjonen 19.april 2016 også planene om en European Open Science Cloud (EOSC). EOSC skal sikre tilgang til data og tilhørende tjenester basert på FAIR prinsippene; Findability, Accessibility, Interoperability, Reusability. EOSC vil bli basert på eksisterende komponenter som er utviklet gjennom europeisk samarbeid eller i medlemslandene og assosierte land.

  • OECD Global Science Forum har to pågående prosjekter knyttet til åpne forskningsdata; Sustainable business models for data repositories og International coordination of data infrastructures for open science. (Norske representanter er henholdsvis Roar Skålin, Forskningsrådet, i den første og Benjamin Pfeil, UiB/Bjerknessenteret, i den andre.)

  • Den 14. september 2016 presenterte Europakommisjonen forslag til nytt opphavsrettsdirektiv. Direktivet er relevant for forskningsdata fordi det omtaler forskernes mulighet til å søke i tekst og data (text and data mining). https://ec.europa.eu/digital-single-market/en/news/proposal-directive-european-parliament-and-council-copyright-digital-single-market

  • I Frankrike er det vedtatt en egen lov om åpen tilgang til forskningsresultater, herunder forskningsdata. https://www.openaire.eu/france-final-text-of-the-law-for-oa-has-been-adopted

Sentrale problemstillinger

Noen problemstillinger som vi antar vil bli sentrale i arbeidet med å utforme en strategi for å gjøre forskningsdata tilgjengelig er:

Finansiering av arkiver for forskningsdata

Løsningene for arkivering av forskningsdata må ha en langsiktighet for at de skal være attraktive. Dette er en forutsetning både for de som deler data og de som bruker dataene. Det er også et krav som stilles både av de som finansierer forskning og tidsskriftene som publiserer resultatene av forskning. Mange av de norske infrastrukturene for forskningsdata er bygget opp gjennom kortsiktig/prosjektbasert finansiering fra NFR som primært er rettet mot selve etableringen av arkivet. Finansiering og plan for videre drift mht. kuratering av dataene, standardisering, sikring av gode metadata, tjenester for forskerne osv. oppleves som usikker og uforutsigbar for en del av dem som leder disse infrastrukturene.

Finansiering av tilgang til arkiver opprettet for forvaltningsformål

Forskningen bruker flere databaser og registre som er opprettet for forvaltningsformål. Eierne av disse databasene/registrene har ikke egen bevilgning eller andre midler for å tilgjengeliggjøre data for forskning. I noen tilfeller må brukerne dekke alle kostnadene ved tilgang. Det kan redusere bruk av dataene i forskning og påvirke hvilken forskning som kan gjennomføres.

Bruk av helsedata i forskning

(forutsetningen om at personvern ivaretas er selvsagt): Dagens situasjon er preget av mange aktører med databehandleransvar som er underlagt ulike forskrifter og formål og hvor komplekse og strenge utleveringsbetingelser vanskeliggjør eller umuliggjør gjenbruk av data. De ulike datasystemene har ulik kvalitet, formater, standarder og grensesnitt som fører til utfordringer vedrørende muligheten for å koble datasett fra ulike databehandlere. Forskerne opplever i dag lite forutsigbarhet mht. tidsbruk og kostnader ved søknad om tilgang til data. Det er ønske om en gjennomgang av de ulike registres forskrifter og omforent tolkning av forskriftene for å lette tilgangen og gjenbruk av data, en effektivisering av tekniske løsninger, mer opplæring av forskerne samt en større forutsigbarhet for forskerne vedrørende søknader om tilgang til data, uten at dette forringer ivaretakelsen av personvernet.

Insentiver for publisering og deling av data

Sett fra forskerens synspunkt er det i dag få insentiver knyttet til å dele data, mens arbeidet med å gjøre data tilgjengelig og brukbare for andre forskere kan være omfattende og gå utover egen vitenskapelig produksjon.

Harmonisering med internasjonale løsninger

Deling av forskningsdata er en internasjonal aktivitet. Det betyr at for eksempel finansieringsmodeller, tekniske løsninger for tilgang (autentisering og autorisering), metadata, lisenser og identifikatorer for datasett må være basert på eller tilpasset internasjonale løsninger. Videre vil forskerne benytte både institusjonelle, nasjonale og internasjonale arkiv for deling av sine data.

Dataomfang

Det produseres enorme mengder med forskningsdata. Det vil ikke være kostnadseffektiv å gjøre alle dataene tilgjengelig, ei heller å lagre dataene. Det må utvikles retningslinjer for å avklare hvilke data som skal tas vare på og gjøres tilgjengelig.

Kultur

Aktører og institusjoner

I Meld. St. 27 (2015-2016) "Digital agenda for Norge – IKT for en enklere hverdag og økt produktivitet er kultursektorens data beskrevet på denne måten:

Data fra denne sektoren er verdifulle for kulturbaserte næringer. Denne typen data vil være lette å formidle og ha bred appell til publikum. Data herfra vil være lett å integrere med andre typer offentlige og private data. Samtidig må man ta hensyn til utfordringer knyttet til tredjeparts opphavsrettigheter. Åpne data om ordninger på kulturområdet vil kunne bidra til en mer transparent kulturforvaltning.

Under Kulturdepartementet er det særlig Nasjonalbiblioteket, Arkivverket og Norsk kulturråd som har store mengder kulturdata. Strategien (som er under arbeid red. anm.) har derfor lagt hovedvekt på disse tre etatenes virksomhet.

Samtidig er det viktig å påpeke at kulturdata og relaterte data finnes i en rekke andre statlige etater og offentlig finansierte institusjoner, både under Kulturdepartementet og andre departementer og forvaltningsnivåer. Det gjelder for eksempel Den Norske Kirke, Språkrådet og NRK, Den norske opera og diverse teatre og konsertarenaene. Som eksempler på kulturdata på andre forvaltningsområder og -nivåer kan nevnes:

Tabell 4. Eksempler på kulturdata på andre forvaltningsområder
Type data Institusjon Ansvarlig departement

Kulturminnedata

Riksantikvaren

Klima- og miljødepartementet/KLD

Museumsdata

Universitetsmuseene

Kunnskapsdepartementet/KD

Museumsdata

Etatsmuseer (flere)

Samferdselsdepartementet m.fl

Arkivkataloger

Fylkesarkivene

Fylkeskommuner

Arkivkataloger

Kommunearkiv/byarkiv

Kommuner

Språksamlinger

Universitetet i Bergen

Kunnskapsdepartementet/KD

Ordbøker

Universitetet i Bergen

Kunnskapsdepartementet/KD

Andre offentlige virksomheter kan også ha stor betydning for en brukervennlig utnyttelse av kulturdata gjennom sammenstilling av data. Et eksempel er Kartverket med sitt rike tilfang av kart- og eiendomsdata. Men også folkeregisteret, Brønnøysundregistrene, kjøretøyregisteret, skipsregisteret og andre registerdata vil kunne sammenstilles med kulturdata. Det er derfor av betydning at en strategi for åpne kulturdata ikke opererer langs skillelinjer som forhindrer en formålstjenlig sammenstilling av data på tvers av både fag-, sektor- og departementsskiller. Dette reflekteres også i digitaliseringsrundskrivet (rundskriv H-7/14) som påpeker at virksomheter med grenseoverskridende ansvarsområder bør samarbeide og gi brukerne et hensiktsmessig og helhetlig tilbud, uavhengig av måten staten er organisert på.

Samlingsdata vs. forvaltningsdata

Strategien skiller mellom samlingsdata (digitalt tilgjengeliggjort samlingsinnhold), og forvaltningsdata (data generert som ledd av etatenes virksomhet). Det er stor forskjell i graden av og forutsetninger for åpenhet på slike data, både grunnet rettigheter, material- og filtyper.

Samlingsdata består som regel av et digitalt objekt, gjerne i form av et bilde av en gjenstand, et foto eller et dokument (innholdsdata), samt beskrivende og tekniske metadata.

Forvaltningsdata er data som etatene og kulturinstitusjonene produserer som en del av sin virksomhet med forvaltning av tilskuddsordninger, kulturarvsobjekter, statistikk o.a. Slike data kan inneholde mye relevant informasjon om norsk kunst- og kulturliv. Også forvaltningsdata kan bestå av innholdsdata og tilhørende metadata. Forvaltningsdata fra statsforvaltningen blir til samlingsdata når de etter hvert avleveres til Arkivverket. Det er viktig å påpeke at skillet mellom samlings- og forvaltningsdata først og fremst har betydning for konteksten de produseres, og til dels tilgjengeliggjøres i. Som åpne data er skillet av mindre betydning.

Arkivverket, Nasjonalbiblioteket og museene er de store forvalterne av samlingsdata, i tillegg til NRK. Både Nasjonalbiblioteket, Arkivverket, Norsk filminstitutt og Norsk kulturråd har dessuten til dels store mengder forvaltningsdata (bl.a. søknadsforvaltning og statistikk) som kan generere kunnskap om kunst- og kultursektoren og bidra til økt transparens. Alle etatene kan i tillegg ha viktige roller i å legge til rette for tilgjengeliggjøring av åpne data gjennom standardisering og infrastruktur.

Beskrivelse av nåsituasjonen

I denne drøftingen og presentasjonen av tilgjengelige data har vi valgt å inkludere datasett som finnes tilgjengelige via søkbare tjenester. Slike data bidrar til å illustrere potensialet i hva som kan gjøres tilgjengelig som åpne data, og er av den grunn inkludert her.

Innholds-/samlingsdata

ABM-sektoren (arkiv, bibliotek og museum) har arbeidet med digitalisering og tilgjengeliggjøring av innhold fra samlingene siden begynnelsen av 1990-tallet. De siste årene har det vært økende oppmerksomhet i sektoren rundt fri viderebruk av samlingsdata som nedlastbare filer, og etter hvert også som maskinlesbare datasett. Utgangspunktet er derfor at det finnes relativt mye innhold, det finnes infrastruktur, og det finnes et utgangspunkt for et felles ramme-/avtaleverk. Samtidig er det viktig å påpeke at det fremdeles finnes mye innhold som ikke er digitalisert, mye data som ikke er åpne, og mye arbeid som gjenstår for at verktøy og standarder kan brukes mer effektivt på tvers av etats- og departementsskiller til åpen tilgjengeliggjøring av kultursektorens data.

Opphavsrettigheter – metadata og «selve innholdet»

For enkelte materialtyper med stort brukspotensial, bl.a. foto, kan både opphavsrettslig vernetid og rettighetshavere være vanskelig å fastslå. Den lange vernetiden for åndsverk (70 år etter opphavers død) vil dessuten kunne skape et fravær av nyere innhold i åpne tjenester og data.

Klarerings- og vederlagsordninger kan gjøre dette landskapet lettere å manøvrere i, og samtidig også gi inntekter til rettighetshavere til materiale som i dag ellers ikke blir brukt. Avtaler og vederlagsordninger etter modell av Nasjonalbibliotekets «bokhylla-avtale» kan muliggjøre en begrenset tilgang og bruk. Det finnes derimot ikke eksempler på avtaler som muliggjør noen grad av fri gjenbruk.

Løsningen per i dag er å skille innholdsdata (digitale objekter) og metadata. Både Arkivverket, Nasjonalbiblioteket og museene publiserer sine metadata mer eller mindre åpent, mens det legges en lisens på det digitale objektet, f.eks. et fotografi (bildefil), en skannet bokside eller et dokument. Det er derimot ingen tradisjon for å markere metadataene med åpne lisenser. I Norge kan det virke overflødig, men i internasjonale sammenhenger kan det være både fordelaktig og til dels nødvendig.

Personvern

Personvernhensyn kan begrense tilgjengeliggjøringen av kulturdata og adgangen til å publisere personbilder og film for viderebruk. For Arkivverket vil personvernet legge til dels store begrensninger for hvilke datasett som kan publiseres som åpne data.

Status for tilgjengeliggjøring

Regjeringen har utarbeidet retningslinjer ved tilgjengeliggjøring av offentlige data. Disse retningslinjene er et godt utgangspunkt for å vurdere tilgjengeligheten til åpne data.

Utvalgte datasett innenfor kultursektoren er i tabellen nedenfor vurdert opp mot retningslinjenes 15 kriterier. Datasettene har fått en karakter for hvert av kriteriene. Karakterene 0 og 1 er markert med rødt for å synliggjøre nødvendige forbedringer. Vi har benyttet følgende skala i vurderingen: 0: Følger ikke kriteriet, 1: Følger kriteriet i svært liten grad, 2: Følger kriteriet i noen grad, 3: Følger kriteriet i svært stor grad.

Tabell 5. Vurdering av kulturdata opp mot gjeldende retningslinjer
Kriterier N-grammer fra NBdigital NBdigital søkeAPI Boklistene Folketellingen for 1910 (Digitalarkivet), søkeAPI Katalogdata fra ASTA DigitaltMuseum Norvegiana

1a. Åpne standardlisenser – som rammeverk

3

0

0

3

3

3

3

1. Åpne standardlisenser – i faktisk bruk

3

0

0

3

3

1

1

2. Maskinlesbare formater

3

3

3

3

3

3

3

3. Gratis data

3

3

3

3

3

3

3

4. Programmeringsgrensesnitt

1

3

1

3

3

3

3

5. Komplett nedlasting

3

0

1

1

1

3

3

6. Faste adresser og unike ID

2

2

2

2

1

1

1

7. Dokumentasjon

2

1

1

2

1

2

2

8. Informasjon

2

0

1

1

1

1

2

9. Synlig

1

1

1

3

2

1

2

10. Brukerbehov

2

2

2

2

1

1

1

11. Tilbakemeldinger

1

1

1

2

2

1

1

12. Uten registrering

2

2

2

3

3

1

3

13. Oppdatert

1

1

1

2

1

3

3

14. Oppmuntre

2

1

1

1

1

0

0

15. Oversikt

2

1

1

0

0

0

0

Totalsum

33

21

21

34

29

27

31

På kriteriene gratis data og maskinlesbare formater skårer de utvalgte datasettene høyt, mens på kriteriene åpne standardlisenser- som rammeverk og åpne standardlisenser i faktisk bruk er det mer ujevnt mellom datasettene. For de øvrige kriteriene gis det jevnt over lavere skår. Selv om tabellen viser svakheter og forbedringspotensial, viser samtidig aktiviteten at det finnes erfaringer, kompetanse og infrastruktur det kan bygges videre på.

Tabellen under viser noen nøkkeltall for 2015 for de mest brukte tjenestene fra etatene (basert på tall fra Google Analytics).

Tabell 6. Nøkkeltall for 2015 for de mest brukte kulturtjenestene
Tjeneste Antall besøk (brukersesjoner) Antall unike brukere Antall sidevisninger

DigitaltMuseum

1,3 mill.

0,8 mill.

15 mill.

UNIMUS (universitetsmuseene)

0,06 mill.

0,03 mill.

0,35 mill.

Digitalarkivet

4,8 mill.

0,8 mill.

190 mill.

NBdigital

3,5 mill.

1,6 mill.

15,8 mill.

Arkivverket

Folketellingen for 1910 er åpent tilgjengelig med et API dokumentert på data.norge.no. I tillegg er emigrantprotokollene i Digitalarkivet og kjøretøyregistret Autosys 1980-90 i ferd med å åpnes som «linked open data» (LOD). Dataene og nytt API vil bli dokumentert på data.norge.no. Videre er katalogdata fra Asta (data publisert i Arkivportalen) tilgjengelige via Norvegianas API.

Digitalarkivet er Arkivverkets kildenettsted – en tjeneste primært for tradisjonell tilgjengeliggjøring av innhold. De mest populære kildene er kirkebøker, folketellinger og panteregistre. Kildene representeres som transkriberte lister eller skannede sider/dokumenter som bildefiler/pdf-filer, og er med få unntak ikke å anse som åpne data. Det er store mengder data i Digitalarkivet, deriblant over 30 mill. personposter, nærmere 1.3 mill. bosteds- og eiendomsposter og skannede versjoner av ca. 50 000 kilder, til sammen ca. 26 millioner bilder av dokumenter/sider. Dataene er tilgjengelige for publikum gjennom enkle eller avanserte person- eller eiendomssøk, og egne navigerings- og blatjenester for ulike kildekategorier. PDF-filer kan hentes fram og lastes ned fra Digitalarkivets nettsider.

Dette illustrerer noe av potensialet ved åpning av data som allerede er tilgjengeliggjort. Brukerne av Digitalarkivet er i hovedsak privatpersoner som slektsgranskere, lokalhistorikere, grunneiere og det allmenne publikum. Digitalarkivet åpnes etter planen for bidrag fra hele arkivsektoren i løpet av kort tid, og vil øke både i innhold og bruk.

Kulturrådet

Kulturrådet forvalter ikke egne samlingsdata, men har siden 1990-tallet (som Norsk museumsutvikling og senere ABM-utvikling) hatt et utviklings- og tilretteleggingsansvar for museene. Dette omfatter også museenes arbeid med digitalisering og publisering, bl.a. gjennom støtte til utviklingen av digitale verktøy og infrastruktur, og gjennom informasjon og holdningsskapende arbeid knyttet til åpenhet og deling. Det er brukt betydelige ressurser i museene til digitalisering og tilgjengeliggjøring de siste årene, og mye innhold er publisert på nett. Likevel gjenstår mye arbeid på veien til representative og åpne museumsdata.

Tabell 7. Digitalisert og publisert i museene per materialtype (alle tall i mill. per 1.1.2015)
Materialtyper Antall Digitalisert Publisert med bilde

Kunsthistoriske gjenstander

0,8

0,2

0,1

Kulturhistoriske gjenstander

3,8

1,3

0,7

Arkeologiske gjenstander

6,7

4,9

4,7

Naturhistoriske gjenstander

10,6

2,1

2,0

Fotografier

33,9

3,1

1,6

I alt

55,8

11,6

9,1

Samlet sett er ca. 16 pst. av museenes samlinger tilfredsstillende publisert på nett, jf. kriteriene i museumsstatistikken. Dette innebærer ikke publisering med åpne lisenser.

De viktigste digitale tjenestene som publiserer og tilgjengeliggjør museumsdata er DigitaltMuseum.no og universitetsmuseenes samlingsportaler UNIMUS.no.

DigitaltMuseum er publikums inngang til digitaliserte museumssamlinger fra museene som sorterer under Kulturdepartementet. DigitaltMuseum inneholder både kunst- og kulturhistoriske data. Noen nøkkeltall for DigitaltMuseum per oktober 2016:

  • 1,2 mill foto

  • 0,6 mill gjenstander

  • 35 000 kunstverk

  • 174 museer/visningssteder

Kun ca. 2 pst. av materialet på DigitaltMuseum, eller ca. 340 000 poster, er merket med åpne lisenser. Selv om hensynet til opphavsrettigheter - og/eller personvern begrenser tilgangen til deler av museumsinnholdet, vil en langt større andel av museenes samlinger kunne merkes med åpne lisenser. En enkel stikkprøve viser f.eks. at for ca. 2.600 kunstverk som har falt i det fri fra et tilfeldig utvalg kunstnere som døde før 1945, er kun 35 objekter merket med åpne lisenser, dvs. godt under 2 prosent.

Alle metadata i museumskatalogene er fritt tilgjengelig.

UNIMUS omfatter følgende tjenester:

Noen nøkkeltall for UNIMUS (universitetsmuseene) per oktober 2016:

  • 1 mill. foto av arkeologiske gjenstander

  • 0,7 mill. fotografier

  • 250 000 gjenstander 174 museer / visningssteder

Alle objektene i UNIMUS-systemene er publisert med Creative Commons (CC) -lisenser. Mange objekter, bl.a. alle arkeologiske gjenstander, er publisert med åpne lisenser som muliggjør viderebruk.

Data fra DigitaltMuseum publiseres via DigitaltMuseums eget API, og via Norvegiana. Data fra UNIMUS er tilgjengelige som nedlastbare filer (hele databasen) og via eget søke-API. I tillegg er hele arkeologisamlingen tilgjengelig via Norvegiana.

Kulturrådets forvaltningsdata

Kulturrådet behandler hvert år ca. 20 000 søknader til over 60 søkbare tilskuddsordninger, og fordeler til sammen ca. 1,2 mrd. kroner til kunst- og kulturfeltet i Norge. Disse søknadsdataene med tilhørende oppfølging og rapportering er ikke tilgengelige p.t., men Kulturrådet har en målsetning om å publisere forvaltningsdata som åpne data innenfor rammen av eksisterende lover og forskrifter innen 2018.

Kulturrådet produserer og publiserer statistikk fra museene (og for arkivene fram til 2013/2014).

Norsk kulturråd er i gang med et prosjekt for statistikk og analyse (SANK prosjektet) som har som målsetting, blant annet, å tilgjengeliggjøre forvaltningsdata fra Norsk kulturråd som åpne data (også på data.norge.no). Digitaliseringen av søknads- og saksbehandlingssystemet i Norsk kulturråd representerer et stort potensial for datafangst, strukturering, presentasjon og analyse av forvaltningsdata. Etableringen av eRapport innebærer strukturering av rapporteringsdata fra tilskuddsmottakere. SANK prosjektet har en målsetting om å øke informasjonsutveksling, samhandling og kunnskapsproduksjon, til gode for hele samfunnet. Kulturrådet mottar årlig opp mot 20 000 søknader fra kunst- og kulturvirksomheter, artister og kunstnere. I tillegg til å gjøre forvaltningsdata tilgjengelige, ligger det i dette prosjektet også et potensial for å kombinere data fra Norsk kulturråd med data fra andre kilder (blant annet offentlige datakilder, kulturinstitusjoner og kulturaktører) for videre statistikkutarbeiding og analyser som vil ha verdi for forskning, politikkutforming og verdiskapning. Åpne data er nøkkelordet her.

Fra og med 2017 legges søker- og tildelingslister ut på Kulturrådets nettsider.

Norvegiana

Norvegiana er Kulturrådets verktøy for å gjøre kunst- og kulturdata lettere tilgjengelig som åpne data. Norvegiana er en database med tilhørende tjenester, med kulturdata fra arkiv, museer og andre kultur-institusjoner; fra i alt ca. 300 virksomheter eller avdelinger. Norvegiana inneholder 7,4 mill. poster totalt (per august 2016). Av dette er 1,9 mill. bilder, 16 000 lydklipp og 1 400 videoer.

Norvegiana er et strategisk virkemiddel for å oppnå flere mål: . Arbeide for mer og bedre åpne data direkte fra eierinstitusjonene . Tilby en samlet tilgang til åpne data på ett sted; “one stop shopping” . Tilby en forenklet tilgang til mer komplekse originaldata via en felles data- og begrepsmodell, et forenklet datainnhold og et felles API . Tilby tjenester om API-basert tilgang for de institusjonene som ikke selv har slike tjenester fra sine systemer Levere norske kunst- og kulturdata til Europeana Norvegiana drives av Norsk kulturråd i samarbeid med flere nasjonale og regionale kulturinstitusjoner (Arkivverket, Riksantikvaren, Fylkesarkivet i Sogn og Fjordane) og kulturarvssystemer (bl.a. DigitaltMuseum /KulturIT, UNIMUS/MUSIT og Arkivportalen/Stiftelsen Asta).

Data i Norvegiana er også tilgjengelige i Europeana. Datasettene er dokumentert på egen nettside data.norvegiana.no, og på data.norge.no.

Nasjonalbiblioteket

Nasjonalbibliotekets nettbibliotek (tidligere NBdigital) er inngangen til Nasjonalbibliotekets digitale samlingsdata. Her finner brukeren visningen av digitale objekter i alle medietyper. De tilhørende metadataene er tilgjengelige via Nasjonalbibliotekets søketjeneste eller søk i Oria. Språkbanken har en egen ressurskatalog med åpne datasett der metadata om språkressurser og selve datasettene er tilgjengelige.       Samlingsdata som ikke er opphavsrettslig beskyttet, kan fritt lastes ned av brukerne. Dette gjelder aviser, bøker, tidsskrift, foto, musikkmanuskripter og privatarkivmateriale. Per i dag er omlag 450 000 norske bøker digitalisert. 30 000 av dem er opphavsrettslig falt i det fri og er nedlastbare.

Gjennom en avtalelisens med Kopinor (Bokhylla-avtalen) kan Nasjonalbiblioteket gjøre tilgjengelig  alle bøker utgitt i Norge før år 2001, selv om de er beskyttet av opphavsrett. Ved inngangen til 2017 vil Bokhylla.no inneholde ca. 250 000 rettighetsbelagte norske bøker med indeksert og søkbar tekst. Dataene er imidlertid kun tilgjengelige for brukere med norsk IP-adresse, og kan dermed ikke uten videre klassifiseres som åpne data. Bokhylla-avtalen åpner heller ikke for fri gjenbruk av rettighetsbelagt materiale.

Nasjonalbiblioteket tilbyr API-er eller andre former for tilgjengeliggjøring for alle datasett som har falt i det fri. Dataene er derimot ikke synliggjort på data.norge.no. Det er nødvendig å få på plass lisensiering for å legge bedre til rette for bruk av datasettene.

Medietilsynet

Medietilsynet forvalter ulike støtteordninger og har oversikt over medie- og avishus i Norge, i tillegg til økonomien og eierskapsforholdene i norske medium. Medietilsynet har blant annet et film- og videogramregister som inneholder 195 500 titler. Registeret er ikke tilgjengeliggjort i sin helhet. Medietilsynet har ingen åpne datasett i dag. Så langt er ikke åpne data omtalt i strategi- eller plandokumenter.

Rapportene som publiseres jevnlig, som årsrapport, allmennkringkastingsrapporten, medieøkonomirapporten, barn og medier-undersøkelsen og rapporteringer til EU publiseres digitalt. Rapportene tilpasses for lesing både på internett, nettbrett og mobil.

Tilgjengelige data (ikke åpne):

  • informasjon om kinofilm (i hovedsak aldersgrenser)

  • tilskuddsordninger (mediestøtte og støtte til lokalkringkasting)

  • radio- og tv konsesjoner

  • medieeierskap

  • aldersgrense på spill (PEGIs spillbase)

  • veiledere for barn og voksne om digitale medier

  • veiledningsfilmer på youtube ==== Norsk Filminstitutt

Norsk Filminstitutt har ingen åpne datasett p.t, men det arbeides med et API for Filmdatabasen. Filmdatabasen består av filmer som Norsk Filminstitutt har eller har hatt i sin festivaldistribusjon. Databasen er et oppslagsverk for norske spillefilmer, kortfilmer og dokumentarfilmer som er produsert siden 2002. Den er ikke en komplett oversikt over norsk film, da den først og fremst inneholder filmer som Filminstituttet har jobbet med. Hvor egnet databasen er når det gjelder deling er noe usikkert, da den først og fremst er et arbeidsverktøy for lansering av film i utlandet. Totalt inneholder databasen ca. 1500 filmer, og antallet øker hele tiden.

Filminstituttet er i ferd med å oppgradere sine saksbehandlingssystemer, og i den forbindelse er det ønskelig å se på hvordan data kan utveksles mellom ulike systemer. Data det her er snakk om er først og fremst knyttet til forvaltningsoppgaver mot fond – dvs. tilskuddordninger og tildelinger i disse.

Status for bruk av åpne data

Generelle betraktninger

Vi har lite kunnskap om bruken av åpne kulturdata. Det finnes foreløpig ingen statistikk som viser bruken av APIene, og det er ikke gjort brukerundersøkelser som kan si noe om hvem som bruker hvilke data til hva. Ingen av etatene har implementert løsninger for logging av bruken av de åpne APIene. Basert på den begrensede informasjonen man har er det grunn til å anta at det er relativt lite bruk av åpne kulturdata, spesielt i form av nye tjenester fra tredjepart.

Erfaringen viser også at det er nødvendig med tiltak for å øke kjennskapen til og bruken av åpne kulturdata.

Direkte tilgjengeliggjøring vs. aggregatorer/data.norge.no

Kulturdata er tilgjengelige gjennom API-er, web-tjenester, filer for nedlasting, bruk av åpne formater, etc. Institusjonene har i varierende grad valgt å bruke fellestjenester som data.norge.no og Norvegiana for dokumentasjon og tilgjengeliggjøring. Det er også noe varierende hvordan datasett og tjenester er dokumentert på institusjonenes egne nettsider.

Tabellen under illustrerer dette.

Tabell 8. Dokumentasjon av kulturdatasett
Datasett Institusjon Dokumentasjon på institusjonens egen nettside Dokumentasjon på data.norge.no Tilgjengelig i Norvegiana

Arkivportalen

Stiftelsen ASTA

Nei

Nei

Ja

Folketellingen 1910

Arkivverket

Nei

Ja

Ja

NBdigital

Nasjonalbiblioteket

Ja

Nei

Nei

Bokhylla

Nasjonalbiblioteket

Ja

Nei

Nei

DigitaltMuseum

KulturIT

Nei

Ja

Ja

Bruk av åpne samlingsdata

Digitalarkivet (Arkivverket) og Bokhylla (Nasjonalbiblioteket) er sektorens mest brukte webtjenester i dag. Populære data i Digitalarkivet er folketellinger, kirkebøker, adressebøker og andre «slektsgranskningrelaterte» data. Av disse er det kun folketellingen fra 1910 som er tilgjengelig som åpne data på data.norge.no. Det finnes ingen statistikk for bruken av denne.

Bokhylla.no vil innen 2017 inneholde omlag 250 000 bøker som er utgitt i Norge til og med år 2000. Teksten er indeksert og søkbar. Dataene er derimot ikke maskinlesbare, og er kun tilgjengelige for norske IP-adresser. Bokhylla er dermed ikke å anse som åpne data. Begrensningene for det rettighetsbeskyttede materialet dikteres av avtalen Nasjonalbiblioteket har gjort med rettighetshaverne.

Bruk av åpne forvaltningsdata

Museumsstatistikken er et eksempel på forvaltningsdata som brukes i økende grad. I tillegg til at statistikken brukes av forvaltningen selv, publiserer Statistisk sentralbyrå museumsstatistikk og bruker tallene videre i sin egen presentasjon av kulturstatistikken. Det private forskningsinstituttet Telemarksforsking er også i gang med å lage en database over museumstatistikken, basert på rådata levert fra Norsk kulturråd. Rådgivningsselskapet Rambøll utarbeider en oversikt over visuell kunst i tall og bruker tall fra museumsstatistikken som en del av bakgrunnsmaterialet.

Nasjonalbiblioteket har ansvar for å samle og presentere den norske bibliotekstatistikken. Her finnes et åpent datasett som viser årlig bestand, tilvekst og bruk av alle fag- og forskningsbibliotek, folke- og fylkesbibliotek i Norge.

Arkivverket, Nasjonalbiblioteket og Norsk kulturråd samler og publiserer statistikkene på henholdsvis arkiv-, bibliotek- og museumsfeltet. De tre statistikkene overlapper til en viss grad på hvilke institusjoner som leverer tall. De har også berøringspunkter der typene materiale i samlingene overlapper. Det er etablert en møteplass for koordinering av spørreskjema, utveksling av erfaringer og diskusjon av arbeidet. Statistiske data fra de tre sektorene bør kunne publiseres som åpne data, og gjerne også med lenking av institusjoner, geografi, material- og samlingstyper.

Hvilke data er etterspurt men ikke tilgjengelige i dag?

Data fra Norsk kulturråds søknadsforvaltning er etterspurt både fra media, forvaltning og forskning (evaluerings- og utredningsprosjekter). Det finnes ingen statistikk over denne etterspørselen, men den oppfattes som relativt stabil de siste årene. Det vanligste er forespørsler om en konkret region eller kategori, og da om hvem som har søkt, hva de har søkt om (både prosjekt og sum) og om de har fått tilskudd eller ikke. Slike data må i dag i stor grad hentes ut og tilgjengeliggjøres manuelt på forespørsel.

Det er generelt stor etterspørsel etter diverse samlingsinnhold i Arkivverket, Nasjonalbiblioteket og museene som ikke er digitalisert eller digitalt tilgjengeliggjort. Eksempler på populære materialtyper er aviser, tidsskrifter, kart, tegninger og foto. Noe av dette materialet, primært aviser og tidsskrifter, er ikke tilgjengeliggjort grunnet komplekse og uavklarte rettighets- og avtaleforhold.

All tekst som digitaliseres i Nasjonalbiblioteket OCR-behandles. Denne tekstgjenkjenningen gjør det mulig å søke på ord og fraser i en scannet bok, en avis eller et tidsskrift. OCR-teksten er dessuten etterspurt av brukere med synshemming eller lesevansker, fordi den kan brukes på leselist og til å generere syntetisk tale. Slike løsninger støter imidlertid på en del utfordringer. Kvaliteten på OCR-teksten bestemmer leseopplevelsen, og materiale som er dekket av avtaler med rettighetshavere er ikke uten videre nedlastbart.

Har tilgjengeliggjøringen gitt nye tjenester?

Tilgjengeliggjøringen av åpne kulturdata har så langt gitt flere nye tjenester. Tjenestene er utviklet gjennom intern bruk av APIer (Digitalarkivet på mobil og Historisk befolkningsregister i Arkivverket), gjennom samarbeidsprosjekter som Kultur- og naturreise eller på direkte initiativ fra eksterne interessenter. De viktigste kjente brukerne, dvs. løsningene/tjenestene som bruker åpne kulturdata fremgår av tabellen nedenfor:

Tabell 9. Oversikt over nye tjenester basert på åpne kulturdata
Tjeneste / løsning Tema Utvikler Data som inngår

Kultursøk

Innsyn; søke i flere samlinger

Webløft; Buskerud fylkesbibliotek

Norvegiana, NBdigital, folkebibliotekkataloger m.m.

Kultursøk

Innsyn; søke i flere samlinger

Regionale kulturnett

Norvegiana

Norgeskart

Mobilapplikasjon; innsyn; søke i flere samlinger

Avinet

Norvegiana, FT 1910

En blå tråd

Innsyn; søke i flere samlinger

Trondheim kommune, byplankontoret

Norvegiana

Kartdemonstratorer

Mobil og nett. Kartvisning av innhold fra flere kilder

Kultur- og naturreise-prosjektet

Norvegiana, og flere andre kilder

KNappen

Mobilapplikasjon

Kultur- og naturreise-prosjektet

Norvegiana, og flere andre kilder

Rallarvegen

Mobilapplikasjon; opplevelser langs Rallervegen

Hordaland fylkeskommune

Norvegiana

Prøysenvandring

Mobilapplikasjon; opplevelser i “Prøysenland”

Hedmark fylkesbibliotek

Norvegiana

Ætteforsker

Mobilapplikasjon

Privat utvikler

Folketelling 1910 og Norvegiana

Stedr

Mobilapplikasjon

Prosjektet TAG CLOUD/Sintef

Norvegiana

Historiske vandreruter

Nett og mobil

Riksantikvaren

Norvegiana

Oslo i gamle dager

Mobilapplikasjon

Privat utvikler

DigitaltMuseum

Nasjonalmuseets samlingssøk

Søk i museets samlinger

Nasjonalmuseet

DigitaltMuseum

Digitalarkivet på mobil

Mobilapplikasjon

Riksarkivet

Digitalarkivet

Søkemotor for bibliotek

Lenkegenerator

Bibliotekarens Beste Venn

NBdigital

Den generelle erfaringen er at tilgjengeliggjøring og bruk påvirker datakvaliteten positivt gjennom brukerkommentarer på feil og nødvendige forbedringer. Gitt at disse blir fulgt opp vil datakvaliteten bli bedre. Nasjonalbiblioteket har som mål å ta i bruk egne APIer internt, bl.a. for å selv kunne finne og rette feil i egne data og dermed heve datakvaliteten raskere.

Planer for nye tilgjengeliggjørings- og formidlingsløsninger for åpne data

Arkivverket

I 2017 vil Arkivverket utbedre, dokumentere og åpne sitt eksisterende søke-API mot de transkriberte person- og eiendomsdataene (innholdsdata) og kildedataene (metadata) fra alle kildekategoriene i hele Digitalarkivet. Noe senere vil indeksdata og andre metadata til de skannede bildene (arkivdokumentene) i Digitalarkivet få et åpent API. Stiftelsen Asta vil trolig også åpne sitt søkeAPI mot de landsomfattende arkivkatalogdataene (metadata) i Arkivportalen.

Kulturrådet /museene

Norsk kulturråd vil tilby museumsstatistikken som åpne data via et API. Både intern og ekstern tilgang til dataene skal kanaliseres gjennom API-et og leveres som JSON (alternativ til XML). Videre behandling, f.eks. som lenkede data, er ikke planlagt, men vurderes videre når API-et er på plass. For øvrige forvaltningsdata er det ikke konkrete planer, utover en generell målsetning om å tilby søknadsdata som åpne data i den grad det er mulig innen 2018.

Museenes digitale infrastruktur er i kontinuerlig utvikling. I 2017 er følgende aktiviteter sentrale:

  • KulturITs økosystem «eKultur» videreutvikles, bl.a. for å forbedre tilgangen til data fra Primus og DigitaltMuseum via felles API-er

  • MUSIT (universitetsmuseene) kjører et omfattende prosjekt med restrukturering av grunnleggende IT-arkitektur, som bl.a. skal ivareta behovene for effektiv tilgjengeliggjøring av samlingene som åpne data

  • KulturNav.org, som er KulturIT sitt verktøy for å skape, forvalte og dele felles åpen terminologi og autoritsregistre) skal videreutvikles for å bedre tilgangen til autoritetsregistre fra eksterne brukere og datasett, bl.a. gjennom et API

Nasjonalbiblioteket

Det følger av Nasjonal bibliotekstrategi 2015-2018 at Nasjonalbiblioteket skal sørge for at folkebibliotekene får tilgang til frie metadata fra en sentral kilde. Nasjonalbiblioteket har derfor inngått en avtale med Bokbasen om å produsere metadata for norske utgivelser fortløpende. Disse vil bli gjort åpent tilgjengelig i flere formater.

Nasjonalbiblioteket lanserer i løpet av 2017 nye nettsider for tilgjengeliggjøring av samlingene. Det utvikles også nye API som brukes som utgangspunkt for formidlingstjenesten som skal finnes på nye nb.no.

Nasjonalbiblioteket skal i samarbeid med Biblioteksystemer lage en ny løsning som erstatter dagens Biblioteksøk (http://www.nb.no/bibsok/start.jsf). Tjenesten er en nasjonal søketjeneste som viser oversikt over hvilket bibliotek som har tilgang til den aktuelle publikasjonen.

Utviklingstrekk

De siste fem årene har åpne og maskinlesbare data gradvis fått mer oppmerksomhet i kultur- og kanskje spesielt ABM-sektoren. Det er likevel fremdeles slik at begreper som åpenhet, tilgjengeliggjøring og viderebruk i de fleste sammenhenger knyttes til tradisjonell tilgjengeliggjøring av samlingsrelatert innhold i tjenester som NBdigital, Digitalarkivet og DigitaltMuseum. Samtidig har utviklingen i den tradisjonelle tilgjengeliggjøringen representert et viktig grunnlag for tilnærmingen til åpne data. Holdninger til deling, åpenhet og viderebruk er endret gjennom de siste 10–15 årene. Behovet for felles autoritetsregistre og vokabularer har vært kjent lenge, men er ytterligere konkretisert gjennom samarbeid og infrastruktur (bl.a. Kultur- og naturreiser, K-lab og KulturNav). Kunnskap om teknologi og lovverk har også utviklet seg positivt gjennom det mer tradisjonelle digitaliserings- og tilgjengeliggjøringsarbeidet.

Produkter og brukere

Den tydeligste «trenden» de siste fem årene er kanskje nettopp åpne og maskinlesbare data, som har gitt et annet perspektiv både på hvilke kulturdata som er relevante i et brukerperspektiv, hvilke målgrupper vi henvender oss til og hvilke sluttprodukter som skal produseres. Sluttproduktet er ikke lenger «bare» en søkbar representasjon av et objekt eller et dokument med beskrivende metadata, men også en åpen tilgang til våre interne forvaltningsdata som data – maskinlesbare, sammenstillbare og gjenbrukbare med andre data i nye kontekster.

Sluttbrukeren kan, som før, være en journalist, forsker eller allment interessert kulturkonsument, men kan også være en kommersiell tjeneste- eller produktutvikler, en kollega i forvaltningen eller i egen virksomhet eller sektor. Bruken kan være av en type vi ikke kunne forutse for 5–10 år siden, og ennå ikke klarer å beskrive dekkende og presist. Det er i dag en økende forventning til at offentlige data er åpent tilgjengelig. Likevel er både tilbud og etterspørsel foreløpig på et svært moderat nivå i kultursektoren. Det er rimelig å anta at bildet er et annet om ytterligere fem år.

Det er skapt økt bevissthet og aktivitet i sektoren, bl.a. gjennom samarbeid som Kultur- og naturreise / K-lab (Norsk kulturråd, Arkivverket, Riksantikvaren og Kartverket). Aktiviteter som hackatons (utviklerseminarer) har både bidratt til tilgjengeliggjøring av relevante data, lisensiering av data, økt oppmerksomhet i offentligheten og konkrete tjenester. Det er etablert god dialog og til dels samarbeid med relevante miljøer internasjonalt (bl.a. Digisam i Sverige og Europeana i EU). Økt tilgjengeliggjøring av data har også gitt mer tverrsektoriell bruk både blant offentlige og kommersielle aktører. Et eksempel er VG presentasjon av databasen Våre falne; http://www.vg.no/spesial/2015/vaare_falne/).

Sammenstilling av data fra ulike kilder har tydeliggjort behovet for felles vokabularer og autoritetsregistre. Selv om det fremdeles gjenstår mye arbeid er initiativer til både infrastruktur og konkrete verktøy igangsatt. Nasjonalbibliotekets arbeid med åpne autoritetsregistre for steds-, person- og korporasjonsnavn, samt KulturITs tjeneste KulturNav er positive eksempler i denne retning.

Praksis har beveget seg fra å tilgjengeliggjøre statiske datasett (CSV, XML) til utvikling av API-er mot løpende oppdaterte databaser. Det er eksperimentert med Linked Open Data (LOD), men det har ennå ikke gitt noe gjennombrudd når det gjelder tjenester og bruk.

Pågående arbeid i sektoren, nasjonalt og internasjonalt

Kultur- og naturreise / K-lab

Kultur- og naturreise var et tverretatlig samarbeidsprosjekt (fra 2012 til 2015) mellom Kartverket, Norsk kulturråd, Riksantikvaren og Arkivverket (Miljødirektoratet deltok 2012-2014). Prosjektet la til rette for at innhold i fagdatabaser hos partnere kunne åpnes opp og gjøres tilgjengelig for bruk og videreutvikling av andre til nye tjenester; av nærings- og reiseliv, i friluftsliv og undervisning. Målet var å øke kunnskap om og skape engasjement for kulturminner og naturverdier. Prosjektet er dokumentert her

K-lab er et utviklingssamarbeid i forlengelsen av Kultur- og naturreise for å gjøre åpne kultur- og kulturminnedata og relaterte geodata mer tilgjengelige. K-lab skal legge til rette for økt bruk gjennom bedre tilgjengeliggjøring, sammenstilling og formidling. I K-lab deltar Kartverket, Riksantikvaren, Arkivverket og Norsk kulturråd. En viktig effekt av K-lab er økt bevissthet rundt relevante problemstillinger og nødvendige tiltak i de samarbeidende organisasjonene. Samarbeidet brukes også som plattform for internasjonale kontakter og samarbeid. Det er bl.a. forsøk på nordiske samarbeid knyttet til hackatons og Linked Open Data (#nordLOD), primært med Digisam i Sverige.

Prosjekter i Norsk kulturråds digitale utviklingsprogram

I perioden 2015-2017 er digital utvikling ett av fire programområder i Norsk kulturråds utviklingsprogram for museumssektoren. Blant prosjektene som har arbeidet med åpne data er Designmodellar frå Figgjo i KulturNAV, Jærmuseet, Videreutvikle museenes digitale økosystem, Lillehammer museum og Norsk folkemuseum (KulturIT). Farleia – kystens livsnerve (museumsnettverket for fiskerihistorie og kystkultur), Samlinger på nett (Nasjonalmuseet for kunst, arkitektur og design) og Digital reiselivshistorisk formidling (Stiftinga Musea i Sogn og Fjordane). Prosjektene arbeider på ulike måter med bruk av åpne data i samlingsforvaltning og formidling.

Felles vokabularer, autoritetsregistre og standarder

Et av behovene som er tydelig adressert i K-lab samarbeidet er autoriserte felles vokabularerog autoritetsregistre. Slike behov går på tvers av etater, sektorer og departement, og krever samarbeid og koordinering for å sikre god og effektiv forvaltning. Det pågår viktig arbeid i flere av etatene på dette området.

Norsk kulturråd har bidratt til etableringen av nettstedet KulturNav.org, som er KulturIT sitt verktøy for å skape, forvalte og dele felles åpen terminologi og autoritetsregistremed særlig fokus på behovene til museer og andre kulturarvsinstitusjoner. Listene publiseres som lenkede åpne data (LOD) i standardisert format. Eksempler på innhold og prosjekter i KulturNav per oktober 2016 er Maritim kulturarv, Poststeder i Norge, Fotografregisteret, Terminologi for forvaltning, drift og vedlikehold av kulturhistoriske bygninger, Terminologi for konservering, og Feltkatalogen 2015 (Feltkatalog for kunst- og kulturhistoriske museer). Andre viktige registre for kulturdata er Bibsys autoritetsregister over personer, Nasjonalbibliotekets autoritetsregister for navn (person- og korporasjon) og nasjonalt (bibliografisk) verksregister som skal være på plass innen 2018, og Kartverkets stedsnavnsregistre.

Nasjonalbiblioteket inngår i en rekke internasjonale samarbeid på biblioteksrelaterte områder som også kan ha interesse utover sektoren. CLARIN er et felles europeisk initiativ som samler språkressurser for å tilrettelegge for utvikling av språkteknologi. IIIF er et internasjonalt samarbeid for å utforme et standardformat for utveksling av bilder. IIPC er et internasjonalt samarbeid for utvikling av standarder for bevaring av internett. Nasjonalbiblioteket har videre startet et prosjekt som skal utrede muligheter for automatisert metadatafangst. Prosjektet startet i januar 2016 og skal ferdigstilles januar 2019.

Opphavsrettslige rammeavtaler

Kulturrådet ga i 2014 tilskudd til BONO (Billedkunst opphavsrett Norge) for å utrede mulighetene for et felles avtaleverk (avtalelisens) for kulturhistorisk fotografi i norske museer. Prosjektet følges nå opp av Norges museumsforbund i dialog med Kulturrådet. Dersom en slik avtale kommer på plass, vil det kunne være relevant for andre i kultursektoren som forvalter kulturhistorisk fotografi og eventuelt også billedkunst, å kunne koble seg på avtalen.

Internasjonale trender og prosesser

Arts Council England har fokus på å tilgjengeliggjøre sine data i tråd med The Freedom of Information Act. De har publisert «Arts Council England data principles», hvor viktige punkter går på transparens, at man skal publisere så mye som mulig så åpent som mulig, og at åpne og lenkede data (LOD) er et mål. Tilgjengeliggjorte data inkluderer tildelinger i form av excel-filer og museumsstatistikk og rapportering som CSV. Det er derimot publisert med lite dokumentasjon og uten API-er, og er dermed å anse som en positiv tendens mer enn åpne data.

Tunge internasjonale museumsaktører forholder seg til CIDOC-CRM og tilbyr data som RDF via SPARQL endepunkter. Andre publiserer til dels åpne data, men med mindre spesifikke modeller/standarder (EDM, Dublin Core) og mindre dokumentasjon.

Digisam er et samordningssekretariat for digitalisering, digital bevaring og digital tilgjengeliggjøring av kulturarvsmateriale i Sverige, etablert av regjeringen/kulturdepartementet i 2011, og med ansvar lagt til Riksarkivet. En lang rekke institusjoner medvirker til Digisams arbeid, bl.a. Kungliga biblioteket (nasjonalbiblioteket) og alle de store museene. Videreføring av sekretariatet er nylig besluttet lagt til Riksantikvarieämbetet. Kunnskapsinnsamling og kompetanseoppbygging på feltet er hovedmålet. Digisam arbeider bl.a. for åpning av offentlige kulturdata ved å utgi anbefalinger, arrangere seminarer, hackatons m.m. En oversikt over deres skriftlige anbefalinger og rapporter finnes her.

Åpne datasett og API-er bekjentgjøres og dokumenteres på oppnadata.se, tilsvarende det norske data.norge.no. Det finnes også et alternativt nettsted, opendata.se.

I tråd med den svenske regjeringens målsetting om en «åpnere forvaltning som bidrar til innovasjon og vekst», har Riksarkivet fått i oppdrag å forenkle situasjonen for dem som vil viderebruke åpne data. Oppdraget omfatter bl.a. å gi hjelp til den enkelte borger med å finne ut hvor i statsforvaltningen åpne data finnes og bistå i kontakten med den aktuelle myndigheten.

Europeana er EUs store satsing for å etablere en felles europeisk tilgang til kunst- og kulturdata. Søkeportalen Europeana.eu gir tilgang til over 50 mill. bøker, billedkunst, filmer, gjenstander og arkivmateriale fra ca. 40 land. Mer enn 2 500 europeiske institusjoner har bidratt til Europeana, alt fra store internasjonale navn som Rijksmuseum i Amsterdam, British Library og Louvre museet, til regionale arkiver og lokale museer. Mona Lisa av Leonardo da Vinci, arbeidene til Charles Darwin og Isaac Newton og musikken til Wolfgang Amadeus Mozart er noen av høydepunktene på Europeana.eu. De mange delprosjektene i Europeana har vært viktige for utvikling av beste praksis, retningslinjer og anbefalinger, samt europeiske fagnettverk på området.

Modenheten for økt tilgjengeliggjøring i sektoren

Det har gjennom mange år vært ulike initiativer med en felles tilnærming til digitalisering og tilgjengeliggjøring i ABM-sektoren på tvers av institusjons- og til dels sektorgrenser, både med tanke på felles prioriteringer, økt datakvalitet og forbedrede publikumstjenester. Internasjonale prosesser, standarder og samarbeid som Europeana og CIDOC (standardisering av utvekslingsformater og felles datamodell) har også vært viktige drivere i denne retning, gjennom et behov for bearbeiding av data, effektiv utveksling av data m.m.

Det finnes lite sammenliknbare tall for åpne kulturdata i Norge og kultursektoren i for eksempel Europa. Likevel indikerer de tall vi har at situasjonen på relaterte områder er vel så god i Norge og Norden enn i Europa for øvrig. Blant annet er Norge den tredje største bidragsyteren til Europeana (regnet i totalt antall etter Nederland og Tyskland) og den desidert største bidragsyteren regnet per capita. Det Europeana-eide prosjektet Enumerate leverte tall i sin rapport «Survey Report on Digitisation in European Cultural Heritage Institutions 2014» som viser at kulturarvssektoren også på andre relaterte områder står seg godt i en sammenlikning med Europa.

Sammenliknet med Sverige derimot kan organiseringen av arbeidet ha bidratt til visse modningsforskjeller. På flere områder knyttet til standardisering, koordinering og veiledning har Sverige kommet lenger enn Norge, antakelig mye grunnet Digisams aktiviteter.

Selv om norske forhold stort sett tåler en sammenlikning med europeiske, er det mye som gjenstår også i sektorens modenhet.

Nasjonalbiblioteket har konkrete strategiske målsetninger på området. De bruker den åpne lisensen CC0 aktivt, bl.a. i nye nettsider, og vil fra 2017 ha bruk av åpne lisenser som internt styringsparameter. De har dessuten en målsetning om å bruke egne APIer internt for å avdekke og utbedre svakheter raskt.

Arkivverket og Norsk kulturråd følger ikke langt etter. Praktisk tilrettelegging av data i tjenester som Norvegiana, Digitalarkivet og Arkivportalen, samt aktiviteter som hackatons, har gitt verdifulle erfaringer i åpning og tilgjengeliggjøring av data. Fellesnevneren her er deltakelse i Kultur og natur-reise og K-lab som har gitt økt bevissthet i organisasjonene. Bevisstheten har derimot ennå ikke materialisert seg i konkrete målsetninger for åpning av egne data.

Når det gjelder museenes samlingsdata er bruken av åpne lisenser avgjørende for videre tilgjengeliggjøring og viderebruk. Her er status at under 2 pst. av materialet på DigitaltMuseum er merket med åpne lisenser, uten at det er åpenbare teknologiske eller juridiske grunner til det lave tallet.

Kjente utfordringer og muligheter

Flere utfordringer for videre tilgjengeliggjøring og bruk av data er også berørt tidligere i dokumentet. Blant de sentrale utfordringene er jus, kompetanse og teknologi.

Opphavsrettigheter

Klarering og bruk av rettighetsbelagt materiale kan være krevende. Det kan også være uklare rettighetsforhold knyttet til materialet som gjør prosessen med rettighetsklarering ekstra vanskelig.

For at nyere materiale skal kunne åpnes kreves et avtaleverk og forvaltningsordninger som gjør klarering og vederlagsbetaling enkelt. Et godt avtaleverk kan bidra positivt til at mere data blir gjort åpent tilgjengelig for viderebruk.

En avtale bør også dekke materiale av ukjente eller ikke-organiserte rettighetshavere, noe som forutsetter en avtalelisens. Slike avtaler kan være spesielt viktig for materialtyper som fotografi og billedkunst. Dette gjelder selv om avtalelisensene ikke tar opp i seg fri viderebruk.

Vi har viktige fortrinn i Norge og Norden, gjennom et godt organisert kunst- og kulturliv, og lange erfaringer med ulike former for kollektivt forvaltede rettigheter og vederlagsordninger. Senere års lovrevideringer har også utvidet rommet for avtalelisenser. Men det gjenstår fortsatt gode prosesser og avtaler.

Økt bruk av rettighetsbelagt materiale vil nødvendigvis gi økte kostnader til vederlag. Kostnadsnivået er derimot umulig å beregne så lenge verken volum, bruksformer eller prismodell er på plass.

Taushetbelagt materiale

Det kan i tillegg til de opphavsrettslige utfordringene også være personvernmessige utfordringer knyttet til tilgjengeliggjøring av åpne data. Sett med kulturrelatert data kan inneholde mange personopplysninger. Eksempel på dette er datasett fra Arkivverket.

Slike problemstillinger vil kreve aktsomhet og god dialog med Datatilsynet og andre relevante myndigheter. Vurderingen av om informasjon som inneholder personopplysninger eller som er underlagt taushetsplikt kan tilgjengeliggjøres, må gjøres på bakgrunn av bestemmelsene i personopplysningsloven og de lover og avtaler som regulerer taushetsplikten knyttet til de aktuelle opplysningene.

Kompetanse og ressurser

Selv om det allerede er gått noen år siden begrepet «åpne data» ble lansert i fagmiljøene, og også noen år siden 2011, da åpen tilgjengeliggjøring av data var overordnet føring i de statlige etatenes tilskuddsbrev, er åpne data som begrep og konsept i begrenset grad implementert i etater og virksomheter. En offensiv iverksetting av føringene i stortingsmelding 27 (2015-2016) Digital agenda for Norge vil være utfordrende for dagens administrative og IKT-faglige ressurser. En betydelig større mengde offentlige kulturdata åpent tilgjengelig vil kreve styrkede ressurser til bl.a. teknisk støtte og nødvendig oppdatering av datasett. Deler av dagens teknologiske infrastruktur er trolig ikke rustet for å gi tilfredsstillende responstid på de datamengdene det kan være snakk om.

Felles autoritetsregistre

Behovet for felles vokabularer og autoriserte registre og lister over personer, steder (nåværende og historiske), materialtyper, prosesser etc. er allerede omtalt. Det er en utfordring i dag å definere hvilke autoritetsregistre sektoren har behov for, hvilke som skal brukes, hvem som skal ha ansvar for å etablere og/eller ivareta disse registrene over tid, og hvordan de skal gjøres tilgjengelige. Slikt ansvar og slike funksjoner bør forankres i miljøer og infrastruktur som kan sikre nødvendig stabilitet og langsiktighet.

Arkivverket – spesifikke problemstillinger

Forvaltningsdata fra offentlige etater skal etter arkivloven avleveres til Arkivverket som arkivmateriale, og blir der å betrakte som samlingsdata. Selv om arkivmaterialet typisk vil være statisk og 5-25 år gammelt (historisk), mens etatenes API-er mot egne forvaltningsdata typisk vil operere mot dynamisk oppdaterte nåtidsdata, vil det trenges avtaler for å forhindre dobbelt åpning av de samme dataene over tid.

Økt tilgjengeliggjøring og bruk – fortrinn og styrker

Det knyttes store forventninger til samfunnsnyttig verdiskaping gjennom økt bruk av kulturdata. Som det sies i Stortingsmelding 27 (2015-2016) Digital agenda for Norge er kultursektorens data_ «verdifulle for kulturbaserte næringer»,_ og de vil være «lette å formidle og ha bred appell til publikum». Dette må anses som et godt utgangspunkt for økt tilgjengeliggjøring og bruk som åpne data. Likevel kan man ikke forvente at aktuelle brukere finner dataene og ser potensialet i dem uten aktiv formidling fra sektorens side.

Selv om kultursektoren skiller seg fra de andre sektorene i strategien ved å inneholde rettighetsbelagt materiale, er det likevel slik at mye av innholdet bør kunne gjenbrukes fritt uten klarering eller vederlag. Dels fordi det er eldre materiale hvor rettighetene har utløpt, eller fordi det er offentlig skapt/eid/finansiert og i stor grad ikke-kommersielt.

Når det gjelder forvaltningsdata bør hovedregelen være at alt kan deles fritt. Unntakene vil kreve rutiner for å fanges opp og administreres, men bør ikke være til hinder for at hovedtrekkene i offentlighetsloven praktiseres også for data.