Hvordan bestemme hva et datasett er og hvilke datasett som skal beskrives?

Erfaringsdeling fra andre virksomheter.

Brønnøysundregistrene: Forskjellige varianter av datasett

Det er fortsatt noe ulike oppfatninger av hva vi forstår med et datasett.

I noen tilfeller blir rammene for settene definert ut i fra hjemmelsgrunnlag, eller et overordnet tematisk/faglig område. For Brønnøysundregistrene er det for eksempel nærliggende å se på innholdet i hvert av registrene som et sett av data.

I andre tilfeller er rammene for datasett noe strammere og nærmere knyttet til prosesser – i form av datautdrag fra et eller flere registre. Eksempler på dette er «nøkkelopplysninger» fra registre, påkrevde identifikasjons- /dokumentasjonskrav eller en bobestyrers informasjonsbehov.

En tredje variant som også blir brukt til å avgrense sett av data, er knyttet til innsendelser/transaksjoner (tjenester). Både av hensyn til arkivering og dokumentasjon, men også i form av «kundeopplysninger».

Åpne data fra Brønnøysundregistrene er datasett som fremstår som selvstendige datasett (Enhetsregisteret) eller datasett som i hovedsak gir mening ved lenking til andre datasett (Frivillighetsregisteret og Partiregisteret). I datasett fra Frivillighetsregisteret og Partiregisteret er grunndata fra Enhetsregisteret i hovedsak utelatt for å hindre dupliserende data, men med felles entydig identifikator i alle datasettene (organisasjonsnummer), er det enkelt å koble registerinformasjonen sammen.

I registersammenheng ansees gjerne hvert register som separate datasett. Ved bruk av lenkede åpne data (LOD) vil begrepet datasett for brukerne gjerne omfatte alt som tilbys som virksomhetsdata. LOD kan koble sammen virksomhetsdata fra f.eks. Enhets-/Foretaks-, Regnskaps- og Løsøreregisteret. I tillegg kan virksomhetsdata fra eksterne LOD-tjenester kobles sammen, f.eks. fra NAV og SKD.