Nasjonal forskningsinfrastruktur for nettdata
Formålet med prosjektet er å legge til rette for forskning på data fra internett. Dataene hentes fra Nasjonalbibliotekets nettarkiv som har høstet den norske delen av internett siden 1990-tallet. Når prosjektet ferdigstilles i 2029, vil brukere av infrastrukturen kunne søke i, visualisere og hente ut historiske data fra internett til forskningsformål.


Hovedmål
I løpet av prosjektperioden (2025-2029) skal vi
- bygge en forskningsplattform for søk, utforskning og uthenting av data
- automatisk klassifisere og vaske tekster med (sensitive) personopplysninger
- merke opp data for å kunne tilby analytiske tjenester (f.eks. hendelsesekstraksjon, sentimentanalyse, analyse av språkutvikling)
- utvikle infrastrukturen i tett samarbeid med forskersamfunnet gjennom behovs- og representasjonsstudier

Viktige forutsetninger
Nasjonal forskningsinfrastruktur for nettdata følger sentrale prinsipper for forskningsdata og kulturarv:
- brukerorientert utvikling, der plattform, tjenester og verktøy har som mål å tilfredsstille forskeres behov
- FAIR-prinsippene, som skal sørge for at forskningsdata er gjenfinnbare, tilgjengelige, at de kan kombineres med andre datakilder og at de kan gjenbrukes
- CARE-prinsippene for urfolksdata
- å tilby så mye data som mulig til så mange som mulig, samtidig som opphavsrett- og personvernlovgivning overholdes

Nyhetsbrev
Forskere og øvrige interesserte kan abonnere på vårt nyhetsbrev, som sendes ut 2-3 ganger i året. Her vil du få oppdateringer om seminarer og workshops og kunne følge utviklingen i prosjektet. Mens prosjektet er i utviklingsfasen, ønsker vi også å knytte til oss interessenter og involvere forskere som testbrukere.
Hva sier forskerne?
WebData støttes av ledende forskere og institusjoner, både i Norge og internasjonalt. Her er noen av støtteuttalelsene vi mottok da vi søkte om prosjektstøtte.