AIM III - Del 2: AI-motor
I den første artikel i denne serie, fokuserede vi på AIM III’s nye behandlingsmotor og på, hvordan den har gjort det hurtigere og nemmere for virksomheder at indsamle store mængder data fra flere forskellige steder med henblik på datafinding.
I denne anden del vil vi se nærmere på AIM III’s nye AI-motor til DataMapper, som snart vil blive anvendt i resten af vores produktportefølje.
AIM III's AI hjælper os med at skalere hurtigere
DataMapper er et automatiseret værktøj til datafinding, der finder, klassificerer og overvåger personlige og følsomme oplysninger på tværs af alle virksomhedens lagringssteder og e-mails og markerer data, der udgør en potentiel risiko.
For at identificere risikodata præcist bruger AIM III en kombination af avancerede AI- og maskinlæringsalgoritmer. Typisk genkender AI-systemer følsomme oplysninger enten ved hjælp af grundlæggende NLP-teknikker som kontekst-NER (som SpaCy anvender) eller regelbaserede (som MS MIP anvender). AIM III’s AI-motor kombinerer en række forskellige AI-tilgange, så den kan genkende gadeadresser, personnumre, aldre, udføre disambiguering og stemningsanalyser og meget, meget mere.
Denne flerstrengede tilgang udvider listen over genkendte enheder fra de sædvanlige navngivne enheder (PERSON-ORGANISATION-LOKALITET) til at omfatte flere detaljer, f.eks. for- og efternavn, eller identificere, om et tal er en alder eller en gadeadresse, for eksempel.
Få en GRATIS licens til ShareSimple i dag!
Sådan byggede vi det: Tekniske detaljer
Systemet vedligeholdes med vores eget datasæt, der repræsenterer en række forskellige virkelige sager, sammen med konstant kvalitetskontrol ved hjælp af et sæt målinger og skaleret med brugergamification, så vi konstant kan forbedre os.
AIM III’s AI-motor er udviklet som en smart kombination af:
- Vores egne kontekstbaserede modeller. Følsomme ord genkendes ved hjælp af de ord, der er omkring dem, f.eks. “Annas personnummer er xxxx-xxxxxx”. I dette tilfælde forstår systemet semantikken og øger dermed nøjagtigheden ved klassificering af numrene som følsomme.
- SpaCys regelbaserede ramme og yderligere valideringsregler. Følsomme tal (xxxx-xxxxxx) genkendes af et filter med regulære udtryk, der kender værdierne af et bestemt tal eller ord.
- Hybrid intelligens, vores AI sammen med menneskelig intelligens i form af gamification for at give vores modeller mulighed for at lære af/støtte hinanden.
- En listebaseret søgning og en tegnbaseret forståelse af navne (fornavn, efternavn og gadeadresse). Modellerne bruger generelle sproglige syntaksregler til at forstå navne, selv om de aldrig har været udsat for dem.
Ved at kombinere disse modeller sammen med forskellige Best-of-Breed AI-værktøjer, der passer til omfanget af vores løsninger til beskyttelse af personlige oplysninger, kan vi skalere AIM til mange lande, sprog og sektorer.
Du kan finde flere oplysninger i første del af denne serie, AIM III: Vores nye behandlingsmotor.
Fordele for vores brugere
Den nye AI-motor til DataMapper vil gøre datafinding nemmere, hurtigere og mere sikker. Med DataMapper kan du opdage, klassificere og spore din virksomheds personlige og følsomme data, uanset hvor de befinder sig. Derefter kan du løbende overvåge alt for at sikre, at dine politikker om beskyttelse af personlige oplysninger bliver overholdt.
Vil du gerne selv se, hvilke typer følsomme og personlige oplysninger din virksomhed gemmer?
Sebastian Allerelli
Specialist i Ledelse, Risiko og GDPR
Følg mig på LinkedIn for at få små tips til GDPR her →