Støtte og opplæring
Ta kontakt med biblioteket ved:

Henrik Holtvedt Andersen
Forskningsdata gjennom forskningsprosjektet
Råd for forskningsdatahåndtering i ulike faser
Planlegging
Ved oppstart av prosjektet, gå gjennom og vurder følgende:
Hvilke datatyper du skal samle inn?
- Observasjonsdata er opptak eller beskrivelser av fenomen. Behovet for bevaring er typisk stort fordi slike data er vanskelige å gjenskape.
- Beregningsdata er data fra modeller, simuleringer og andre beregninger. Om det er inndata og/eller utdata samt algoritme som bør bevares vil variere.
- Eksperimentelle data er resultater fra kontrollerte forsøk. Hvis forholdene for eksperimentet ikke kan gjenskapes kan det være behov for å bevare dataene.
- Kildedata omfatter dokumenter, opptak, registre og andre kilder blir forskningsdata når det brukes som grunnlagsmateriale i forskning. Ofte vil disse være tilstrekkelig godt bevart andre steder og det er nok å dokumentere hvor de befinner seg
Hvor åpent eller lukket dataene skal lagres, både underveis og i etterkant?
- Åpen eller fritt tilgjengelig (Grønn):
Dersom det ikke forårsaker noen skade for offentlige interesser, universitetet, enkeltperson eller samarbeidspartner at informasjonen blir kjent for uvedkommende eller endres utilsiktet. - Begrenset (Gul):
Dersom det vil kunne forårsake en viss skade for offentlige interesser, universitetet, enkeltperson eller samarbeidspartner at informasjonen blir kjent for uvedkommende eller endres utilsiktet. - Fortrolig (Rød):
Benyttes hvis det vil kunne forårsake skade for offentlige interesser, universitetet, enkeltperson eller samarbeidspartner hvis informasjonen blir kjent for uvedkommende eller endres utilsiktet. - Strengt (Svart):
Benyttes dersom det vil kunne forårsake betydelig skade for offentlige interesser, universitetet, enkeltperson eller samarbeidspartner at informasjonen blir kjent for uvedkommende eller endres utilsiktet.
Mer om personvern og behandling av persondata
Klassifisering av data fra UiO
Datahåndteringsplan
Se vår side om datahåndteringsplan
En datahåndteringsplan beskriver hvordan forskningsdataene håndteres underveis i et prosjekt og hvor åpent de kan deles etter publisering og etter at prosjektet er ferdig.
Den inneholder følgende informasjon:
- Om DHPen
- Om forskningsprosjektet
- Juridiske og etiske hensyn
- Lagring og beskyttelse av data underveis i prosjektet
- Gjenbruk eller innsamling av data
- Datadokumentasjon underveis i prosjektet
- Prosessering, analyse og tolkning av data
- Arkivering og publisering av data
- Ansvarsfordeling og ressursbehov
Det er opp til deg hvordan du utformer en DHP, men det finnes maler som kan hjelpe deg, for eksempel Sikt sin mal til å lage en datahåndteringsplan.
Norges forskningsråd, EU, ERC og andre finansiører har krav om innlevering av datahåndteringsplan.
Organisering av forskningsdata
I et forskningsprosjekt er det å ha gode filnavn, standardiserte og ikke-proprietære filformater og en god mappestruktur med på å gi god oversikt, noe som igjen er tidsbesparende.
Vurdering av lagringsløsning og tilgangsstyring
Størrelsen på datasettet – både med tanke på filstørrelse og antall filer – påvirker hvilke lagringsløsning du bør velge og hvordan dataene skal organiseres og dokumenteres underveis i prosjektet. Det kan også påvirke arbeidsflyten i prosjektet med tanke på kvalitetssikring, overføring av filer, tilgangsstyring og analyse.
Basert på planen for analyse, størrelsen på dataene, kompleksiteten i prosjektet, og andre faktorer (f.eks. planlagt feltarbeid), vurder om det er et behov for utstyr, ekstra lagringsplass og programvarer eller annet at du ikke har tilgang til foreløpig. Kontakt IT for støtte med dette og se vår lagringsguide.
Dersom andre enn deg selv trenger tilgang til dataene underveis i eller etter prosjektet, tenk nøye gjennom hvem som bør ha tilgang til hva og hvordan de kan få det. Dette er særlig viktig når dataene inneholder sensitiv eller klassifisert informasjon.
Gjennomføring
Underveis i prosjektet er det viktig å ha god kontroll på lagring, for å sikre datakvalitet og unngå datatap.
Organisering og dokumentasjon
Se hvordan du bør organisere dataene dine
Dokumentasjon av forskningsdata er beskrivelser av hva du gjør og har gjort med dataene underveis i et prosjekt.
Gode rutiner for å dokumentere hva som gjøres i prosessen med innsamling, bearbeiding og analyse er del av metode og god forskningspraksis.
Eksempel på verktøy du kan bruke for dokumentasjon inkluderer:
- et rent tekstdokument.
- notatbokverktøy som OneNote
Når data skal arkiveres, legges dokumentasjon i en ReadMe-fil. En ReadMe-fil er en detaljert veiledning til datasettet som gjør det mulig for andre forskere å forstå og gjenbruke dataene du arkiverer.
Her er et eksempel på en mal til en ReadMe-fil
Lagring
Dataanalyse, prosessering og Kunstig intelligens
[under produksjon]
Deling underveis
[under produksjon]
Avslutning
Ved prosjektslutt må du først ta stilling til hva som skal slettes og hva som skal tas vare på, og hva som skal gjøres tilgjengelig etter prinsippet "så åpent som mulig, og så lukket som nødvendig".
Beskrivelse av dataene
Dokumentere proveniens via en ReadMe-fil: hvor og hvem som har samlet, beskrevet og arkivert dataene.
En ReadMe-fil er en detaljert veiledning til datasettet som gjør det mulig for andre forskere å forstå og gjenbruke dataene du arkiverer.
Her er et eksempel på en mal til en ReadMe-fil
Filformat
Data må eksporteres til arkivvennlige åpne formater. Om foretrukne filformater her.
Lisenser
Lisensene bør være internasjonalt anerkjente, maskin- og menneskelesbar, samt legge så få begrensninger som mulig på tilgang, gjenbruk og videredistribusjon av dataene.
Vi anbefaler CC-BY 4.0 hvis mulig. Det betyr at dataene kan gjenbrukes, modifiseres og utnyttes kommersielt mot henvisning/sitering.
Arkivering
Publisering av forskningsdata og tilhørende metadata i et forskningsarkiv sikrer langtidsbevaring og gjenbrukbarhet. Forskningsdata bør gjøres tilgjengelig senest ved publisering av den vitenskapelige artikkelen.
Valg av arkiv
Et fagspesifikt arkiv vil gjøre dataene dine mer synlige for andre forskere på feltet.
Når det ikke finnes passende fagspesifikke arkiv, anbefaler vi å bruke et generelt arkiv.
Arkivet bør legge til rette for god gjenfinning ved å følge FAIR-prinsippene.
Ønsker du å lese mer om valg av arkiv, anbefaler vi OpenAIRE sin guide.
Fagspesifikke arkiv
Du kan lete etter et passende fagspesifikt arkiv på re3data.org.
Generelle arkiv
- DataverseNO - nasjonalt arkiv for generell forskningsdata fra alle fagfelt. MF har en egen samling og det kurateres av MF.
Det er CoreTrustSeal-sertifisert som et pålitelig og bærekraftig arkiv som sørger for langtidsbevaring av arkiverte data.
Her får hvert datasett tildelt en DOI og en automatisk generert referanse til bruk i publikasjoner.
Data fra arkivet blir gjort søkbare i tjenester av typen Google Dataset Search.
Arkivet har også versjonskontroll, som registrerer og synliggjør alle endringer som er gjort i datasettet etter publisering.
Mer informasjon og brukerveiledninger finner du på denne infosida: https://info.dataverse.no/. - Sikt - et nasjonalt arkiv som forvaltes av Sikt (Kunnskapssektorens tjenesteleverandør).
Fokuset ligger på å bevare data fra samfunnsvitenskapelig og humanistisk forskning, samt noe fra medisinsk og helseforskning. NSD kuraterer arkiverte data.
For data som inneholder personidentifiserende informasjon, anbefaler vi Sikts arkiv. - Zenodo - EUs arkiv for forskningsdata. Her kan du arkivere data og andre dokumenter fra alle fagområder. Zenodo kurateret ikke arkiverte data.
Gjenbruk
Mye forskning bygger på data fra eksisterende kilder.
Bruk av data fra eksisterende kilder
Kildedata omfatter dokumenter, opptak, registre og andre kilder blir forskningsdata når det brukes som grunnlagsmateriale i forskning. Ofte vil disse være tilstrekkelig godt bevart andre steder, og det er nok å dokumentere hvor de befinner seg.
Når du skal gjenbruke data fra andre kilder, er det viktig å kunne gi informasjon om:
- hvor dataene kommer fra?
- hvilken versjon som er brukt?
- hvordan de ble samlet inn?
- hvem som står bak?
- må dataene rengjøres eller bearbeides før bruk i prosjektet?
- annen informasjon som er nødvendig for å kunne etterprøve resultatene
Avklaring av lisens
Det er viktig å avklare hvilken type lisens eller annen avtale som beskriver hvordan datasettet kan brukes.
Publisert tekst er ofte omfattet av opphavsrett som kan begrense videre deling av materialet. Dersom det er materiale med CC-lisenser, vil videre bruk og deling være enklere. For annet materiale er det nødvendig å få tillatelse fra utgiver eller opphavsperson for å publisere på nytt. Enkelte utgivere gir tillatelse til videre bruk med begrensinger, som eksempelvis til undervisnings og forskningsformål ved institusjonen. Da kan ikke materialet arkiveres åpent.
For materiale fra norske kilder som ligger på nett, kan det være lurt å kontakte Nettarkivet på Nasjonalbiblioteket.