Derfor er forskellen på struktureret data og ustruktureret data vigtig
Hvad er struktureret data?
Struktureret data er organiseret i et klart defineret format, typisk i tabeller eller databaser, hvor datafelter er forudbestemt (f.eks. rækker og kolonner). Det gør det nemt at søge, analysere og manipulere.
Kendetegn ved struktureret data
- Data har en fast struktur (rækker og kolonner i en database, som f.eks. SQL).
- Hver dataenhed passer i et foruddefineret felt (f.eks. navn, adresse, telefonnummer).
- Det er nemt at søge, filtrere og analysere.
- Bruges ofte i relationelle databaser.
Eksempler på struktureret data
- Kundedata i en CRM-database (f.eks. navn, e-mail, telefonnummer).
- Finansielle transaktioner (beløb, dato, kontonummer).
- Excel-ark med veldefinerede kolonner.
Fordele ved struktureret data
- Let at søge og tilgå med definerede machine learning (ML) algoritmer
- Let at spore og forstå udfaldet
- Kræver mindre behandling og er lettere at håndtere
Ulemper ved struktureret data
- Mindre fleksibelt da strukturen er pre-defineret og ikke kan rykkes ved
- Det tager flere tid og ressourcer at ændre og opdatere formatet
Start GDPR-oprydningen hvor det trænger mest
Følsomme data kan let ophobe sig i medarbejdernes mails. Med et GDPR Risiko-scan fra DataMapper får I en rapport, der viser potentielle GDPR-risici i virksomhedens Outlook-konti.
Hvad er ustruktureret data?
Omtrent 80-90% af hele verdens data er ustruktureret. Denne type data mangler en defineret struktur og passer ikke let ind i et databaseformat. Den indeholder ofte tekst, billeder, lyd eller video og kræver mere avanceret behandling og analysemetoder (f.eks. tekstmining eller billedgenkendelse) for at udtrække værdifuld information.
Kendetegn ved ustruktureret data
- Data har ingen fast struktur eller format.
- Information er ofte gemt i filer som dokumenter, billeder eller lydfiler.
- Det er sværere at søge og analysere uden specialiserede værktøjer.
- Bruges ofte i NoSQL-databaser eller big data-løsninger.
Eksempler på ustruktureret data
- E-mails, PDF-dokumenter, sociale medieindlæg.
- Videoer, billeder, lydoptagelser.
- Chatsamtaler, blogindlæg, rapporter.
Fordele ved ustruktureret data
- Det er mere tilpasningsdygtigt
- Det kan indsamles hurtigt og nemt
- Det er billigt og let at opbevare i større mængder
Ulemperne ved ustruktureret data
- Manglende synlighed
- Svært at gennemskue hvordan det bruges og beskyttes bedst
- Datastyringsværktøjer er nødvendige for at manipulere med ustrukturerede data
Vil du vide mere om ustruktureret data?
I vores nyhedsbrev du får tips og tricks til hvordan du lettere kan håndtere GDPR fra vores grundlægger Sebastian Allerelli.
Når du tilmelder dig vores nyhedsbrev, får du samtidig en gratis licens for én bruger til ShareSimple, som giver dig en e-mail i Outlook. Dette særlige tilbud er kun for nye kunder, med en grænse på én licens pr. virksomhed.
Struktureret og ustruktureret data i applikationer
Når man taler om struktureret og ustruktureret data, er det vigtigt at forstå, at man ikke kan opdele applikationer som værende strukturerede og ustrukturerede. Mange moderne applikationer håndterer nemlig begge typer data samtidig. For eksempel kan en CRM-applikation eller en mail-servicer behandle kontaktoplysninger om kunder i et struktureret format, men samtidig rumme e-mails og noter i et ustruktureret format. Det handler dels om hvordan data behandles og dels i hvilket format data er i, eftersom visse datatyper er ustrukturerede af natur – eksempelvis billeder og videoer, der ikke passer ind i en standardiseret datamodel.
Ustruktureret data i praksis
Ustruktureret personlig data og GDPR
En nemmere måde at håndtere ustrukturerede data
Sebastian Allerelli
Grundlægger & COO hos Safe Online
Specialist i Ledelse, Risiko og GDPR