Skip to main content

Derfor er forskellen på struktureret data og ustruktureret data vigtig

I en verden, hvor mængden af data vokser eksponentielt, er evnen til at forstå og arbejde med forskellige datatyper afgørende. Data kan overordnet opdeles i to kategorier: struktureret og ustruktureret. Struktureret data er organiseret på en fast måde, mens ustruktureret data er langt mere kompleks og ikke følger en fast struktur. At forstå forskellene mellem disse to typer data er nøglen til effektiv analyse, styring og beskyttelse af data.

Hvad er struktureret data?

Struktureret data er organiseret i et klart defineret format, typisk i tabeller eller databaser, hvor datafelter er forudbestemt (f.eks. rækker og kolonner). Det gør det nemt at søge, analysere og manipulere.

Kendetegn ved struktureret data
  • Data har en fast struktur (rækker og kolonner i en database, som f.eks. SQL).
  • Hver dataenhed passer i et foruddefineret felt (f.eks. navn, adresse, telefonnummer).
  • Det er nemt at søge, filtrere og analysere.
  • Bruges ofte i relationelle databaser.
Eksempler på struktureret data
  • Kundedata i en CRM-database (f.eks. navn, e-mail, telefonnummer).
  • Finansielle transaktioner (beløb, dato, kontonummer).
  • Excel-ark med veldefinerede kolonner.
Fordele ved struktureret data
  • Let at søge og tilgå med definerede machine learning (ML) algoritmer  
  • Let at spore og forstå udfaldet 
  • Kræver mindre behandling og er lettere at håndtere  
Ulemper ved struktureret data
  • Mindre fleksibelt da strukturen er pre-defineret og ikke kan rykkes ved 
  • Det tager flere tid og ressourcer at ændre og opdatere formatet 

Start GDPR-oprydningen hvor det trænger mest

Følsomme data kan let ophobe sig i medarbejdernes mails. Med et GDPR Risiko-scan fra DataMapper får I en rapport, der viser potentielle GDPR-risici i virksomhedens Outlook-konti.

Hvad er ustruktureret data?

Omtrent 80-90% af hele verdens data er ustruktureret. Denne type data mangler en defineret struktur og passer ikke let ind i et databaseformat. Den indeholder ofte tekst, billeder, lyd eller video og kræver mere avanceret behandling og analysemetoder (f.eks. tekstmining eller billedgenkendelse) for at udtrække værdifuld information.

Kendetegn ved ustruktureret data
  • Data har ingen fast struktur eller format.
  • Information er ofte gemt i filer som dokumenter, billeder eller lydfiler.
  • Det er sværere at søge og analysere uden specialiserede værktøjer.
  • Bruges ofte i NoSQL-databaser eller big data-løsninger.
Eksempler på ustruktureret data
  • E-mails, PDF-dokumenter, sociale medieindlæg.
  • Videoer, billeder, lydoptagelser.
  • Chatsamtaler, blogindlæg, rapporter.
Fordele ved ustruktureret data
  • Det er mere tilpasningsdygtigt 
  • Det kan indsamles hurtigt og nemt 
  • Det er billigt og let at opbevare i større mængder
Ulemperne ved ustruktureret data
  • Manglende synlighed
  • Svært at gennemskue hvordan det bruges og beskyttes bedst
  • Datastyringsværktøjer er nødvendige for at manipulere med ustrukturerede data

Vil du vide mere om ustruktureret data?

I vores nyhedsbrev du får tips og tricks til hvordan du lettere kan håndtere GDPR fra vores grundlægger Sebastian Allerelli.

Når du tilmelder dig vores nyhedsbrev, får du samtidig en gratis licens for én bruger til ShareSimple, som giver dig en e-mail i Outlook. Dette særlige tilbud er kun for nye kunder, med en grænse på én licens pr. virksomhed.

Struktureret og ustruktureret data i applikationer

Når man taler om struktureret og ustruktureret data, er det vigtigt at forstå, at man ikke kan opdele applikationer som værende strukturerede og ustrukturerede. Mange moderne applikationer håndterer nemlig begge typer data samtidig. For eksempel kan en CRM-applikation eller en mail-servicer behandle kontaktoplysninger om kunder i et struktureret format, men samtidig rumme e-mails og noter i et ustruktureret format. Det handler dels om hvordan data behandles og dels i hvilket format data er i, eftersom visse datatyper er ustrukturerede af natur – eksempelvis billeder og videoer, der ikke passer ind i en standardiseret datamodel.

Ustruktureret data i praksis

På verdensplan er ustruktureret data langt mere udbredt end struktureret data. Da ustruktureret findes i langt flere formater og er let at opbevare, så er det ikke unormalt at langt de fleste virksomheder har en betydelig større mængde ustruktureret data opbevaret i deres systemer.
Det er svært at administrere ustruktureret data uden de rette værktøjer, fordi dens rå og uorganiserede karakter gør det svært at søge og få adgang – og det giver en lav synlighed. 
Structured data examples

Ustruktureret personlig data og GDPR

Mængden af ustruktureret data, som jeres virksomhed har indsamlet gennem årene, indeholder statistisk set masser af personlig data og følsomme personlige data, og udgør en udfordring i forhold til overholdelse af GDPR, CCPA og andre forordninger.  
Disse lovgivninger sætter grænser for, hvor længe I opbevarer personlige data, og de kræver, at I overvåger og beskytter dem for at sikre, at de ikke vil blive tilgået af uautoriserede personer. At efterlade ustrukturerede filer i datasiloer, uden at holde styr på de personlige data, der er indeholdt i dem, er en sandsynlig måde at få bøder på fra f.eks. Datatilsynet. I bør sørge for, at personlige data ikke forbliver i jeres systemer længere end højst nødvendigt. Når I ikke længere bruger data til det formål, at de er indsamlet, bør de slettes. 
For at opfylde disse krav skal du have systemer på plads til at sortere, klassificere og overvåge ustrukturerede persondata. 

En nemmere måde at håndtere ustrukturerede data

Teknologien er nødt til at følge med den stigende efterspørgsel til håndtering af ustruktureret data. Vores Data Discovery-værktøj, DataMapper, er ideelt til håndtering af ustruktureret data, på en måde, hvor man er ansvarlig med folks følsomme oplysninger og samtidig overholder GDPR.

Sebastian Allerelli
Grundlægger & COO hos Safe Online
Specialist i Ledelse, Risiko og GDPR

Følg mig på LinkedIn for at få små tips til GDPR her →

GUIDE

Håndtering af følsomme persondata

GUIDE

Sådan findes persondata med Datamapping

GUIDE

Forberedelse til et datatilsyn