Forskningsdata

Med forskningsdata avses information som samlas in eller genereras under forskningsprocessen och som ligger till grund för de resultat och slutsatser som forskningen genererar. Att publicera och göra forskningsdata öppet tillgängliga ger ökad transparens och tillförlitlighet för presenterade resultat och publikationer. Det ger även andra möjlighet att hitta och återanvända befintliga data i ny forskning.

Här ges en introduktion till publicering och citering av forskningsdata. På Medarbetarportalen finns utförlig information om universitetets stöd vid hantering av forskningsdata under hela forskningsprocessen – insamling, analys, lagring, publicering och arkivering med mera.

Publicera och tillgängliggöra forskningsdata

Genom att publicera och tillgängliggöra data kan andra återanvända och citera forskningsdata. Därigenom kan de ursprungliga upphovsmännen få erkännande och akademisk meritering för data som genererats i ett projekt.

I 2016 års forskningspolitiska proposition (2016/17:50) presenterade regeringen målbilden att en omställning till öppen tillgång till forskningsresultat - vetenskapliga publikationer, konstnärliga verk och forskningsdata - bör vara genomförd fullt ut senast inom tio år, det vill säga 2026. Det ligger i linje med EU:s strävan efter ökad öppenhet för forskningen.

Det finns flera sätt att publicera forskningsdata och göra data öppet tillgängliga:

  • De data som en vetenskaplig publikation bygger på kan publiceras som kompletterande material, antingen på förlagets webbplats eller i ett öppet datarepositorium.
  • Man kan deponera forskningsdata i ett öppet datarepositorium och även publicera ett så kallat data paper som beskriver dessa data. Den typen av artiklar omfattar inte analys av data utan fokuserar på att beskriva ett dataset när det gäller innehåll, ursprung, och struktur.
  • Man kan publicera ett dataset i ett öppet datarepositorium utan tillhörande publikation. Det finns en mängd datarepositorier - ämnesspecifika, institutionella och generella - som kan användas för att tillgängliggöra forskningsdata. Välj gärna etablerade ämnesspecifika datarepositorier i första hand. Hos re3data.org finns en utförlig förteckning.

Tänk på att vid publicering av ett dataset kan angivna upphovsmän och roller vara andra än de som anges i publikationer vars analys och resultat bygger på dessa data. För exempel på roller se CRediT – Contributor Roles Taxonomy

För att underlätta för andra att återanvända publicerade data kan man ange eventuella villkor för användning, exempelvis med hjälp av Creative Commons licenser. För licenser för kod och mjukvara se Choose a licence.

All data kan inte delas eller publiceras
Det kan finnas juridiska och/eller etiska skäl att inte dela eller publicera forskningsdata. Det gäller exempelvis data som innehåller känsliga personuppgifter och som då omfattas av dataskyddsförordningen (GDPR) eller annan lagstiftning. Det kan även gälla material som är sekretessbelagt enligt OSL (SFS 2009:400), som innehåller företagshemligheter, är upphovsrättsskyddat av någon annan eller som innehåller annan information som av juridiska eller etiska skäl inte bör spridas. Även om vissa data inte direkt kan delas, publiceras eller göras öppet tillgängligt kan de ändå registreras och bli sökbara i kataloger över forskningsdata. Då kan man även ange de förutsättningar och villkor som finns för att få tillgång till data.

Fördelar med att publicera forskningsdata

Ökat genomslag: att publicera data ger fler möjligheter till genomslag och meritering tack vare andra forskares citeringar av och registrerade nedladdningar av data. Därigenom kan man som forskare få erkännande för andra bidrag än publikationer.

Ökat samarbete: om dina data publiceras och görs tillgängliga blir du som forskare mer synlig. Sannolikheten att andra forskare får kännedom om din forskning och dina resultat ökar. Resultaten kan bli nya kontakter och samarbetsmöjligheter, både nationellt och internationellt.

Minskat dubbelarbete: genom att dela data kan forskarsamhället fokusera på att ta fram nya data istället för att återupprepa redan gjorda datainsamlingar och analyser.
Forskningens integritet och transparens: att tillgängliggöra data ökar möjligheten att kunna verifiera och reproducera publicerade forskningsresultat.

Samhällsnytta: det är värdefullt att offentligt finansierade forskningsresultat – både publikationer och data - i så hög grad som möjligt görs öppet tillgängliga för resten av samhället.

Tillgodose krav och följa rekommendationer: finansiärer, förlag, lärosäten och andra aktörer har ofta krav på att forskningsdata ska publiceras.

Citera forskningsdata

Precis som vetenskapliga publikationer kan även forskningsdata och kod citeras. För att forskningsdata ska kunna citeras bör ett datasetet tilldelas en permanent identifierare, t.ex. ett DOI- (Digital Object Identifier) eller ett urn:nbn-nummer.

Citering av ett dataset ska innehålla tillräcklig information för att den korrekta versionen ska kunna identifieras. Följande uppgifter bör ingå i en referens för ett dataset:

  • Upphovsperson
  • Publiceringsår
  • Titel
  • Version
  • Datarepositorium
  • Resurstyp
  • DOI eller annan unik identifikator

Riktlinjer för utformning av citering och referens för ett dataset kan skilja sig mellan förlag och olika bibliografiska stilar. Se även Referensguiden för allmän information om referenshantering.

DataCite är en organisation som arbetar med att göra forskningsdata sökbara och möjliga att citera, bland annat genom att ge datarepositorier via DataCite kan tilldela dataset DOI-nummer. DataCite har i samarbete med CrossRef och andra organisationer utvecklat tjänsten DOI Citation Formatter där man kan skapa referenser i ett stort antal bibliografiska stilar för dataset med DOI-nummer.

Lästips

"Fler citeringar med återbruk av data", artikel i Vetenskapsrådets tidning Curie.

"Tillgängliggöra data i forskningsprocessen", Svensk Nationell Datatjänst