Dat data waardevol is voor uw operatie, besluitvorming en de nakoming van regelgeving is u inmiddels wel duidelijk. Net als de noodzaak om deze data te managen, om zo effectief en kostenefficiënt te kunnen ondernemen en uw risico’s te beheersen. Wie het wiel niet opnieuw wil uitvinden, heeft waarschijnlijk van Data Management Body of Knowledge (DAMA BMBOK) gehoord en het wellicht zelfs al omarmd. En zal dan ook bemerkt hebben hoe uitgebreid dit de-facto data management framework is, wat het lastig maakt om snel de reikwijdte te overzien en nog lastiger om uit te leggen.
Natuurlijk is er het ‘DAMA-wiel’: een opsommend overzicht van alle door DAMA DMBOK onderscheiden gebieden, ofwel ‘subject area’s’.
Een beperking van dit model is dat het geen inzicht geeft in de samenhang en inhoud van deze subject area’s.
Om belanghebbenden en belangstellenden sneller mee te kunnen nemen in de wondere wereld van DAMA DMBOK hebben we een uitgebreider overzicht gemaakt. Of eigenlijk: drie overzichten in verschillende detailniveaus. Naast een overzicht van deze DAMA-gebieden bevat het de volgende informatie:
- Een logische groepering van de subject area’s
- De belangrijkste relaties tussen subject area’s onderling
- De belangrijkste functies per subject area
Deze eerste blog uit een serie beschrijft kort de rol van de verschillende subject area’s en de logische groepering ervan die wij gebruiken. Hierna volgende blogs zijn gewijd aan de onderlinge relaties en de functies van de subject area’s.
Groepering
Om twaalf subject area’s in een overzichtelijk model te ordenen, hebben wij ze opgedeeld in vier gebieden:
- Control (Beheersing)
- Availability (Beschikbaarheid)
- Quality (Kwaliteit)
- Insight (Inzicht)
We zullen deze groepen en de subject area’s per groep kort beschrijven:
Control (Beheersing)
Deze groep bevat de subject area’s met als gemeenschappelijk doel het beheer en beschermen van de data.
- Data governance regelt de juiste organisatie rond data, waaronder eigenaarschap en verantwoordelijkheden. Het formuleert de doelstellingen en de uitlijning met de strategie van de organisatie. Daarnaast definieert het de organisatie, rollen, richtlijnen, beleid en de processen om dit te borgen.
- Data security is verantwoordelijk voor de bescherming van de data om de integriteit, vertrouwelijkheid en de privacy-bewaking rond de data te waarborgen.
- Metadata management zorgt voor het beheer van informatie (data) over uw data: ofwel ‘metadata’. Deze metadata is nodig om de data als ‘assets’ te kunnen beheren. Denk hierbij bijvoorbeeld aan de classificaties voor integriteit, vertrouwelijkheid en privacy en de logfiles die de toegang tot data registreren: allemaal metadata nodig voor security. Maar ook de betekenis van data, eigenaarschap en de locaties waar data te vinden is zijn voorbeelden van metadata. Zonder metadata is het onmogelijk om data op eenduidige wijze te beheren.
Availability (Beschikbaarheid)
Deze groep bevat de subject area’s die zorgen dat data bewaard en beschikbaar gesteld wordt aan de betreffende gebruikers, waar en wanneer nodig.
- Data storage is het gebied dat ervoor verantwoordelijk is dat data wordt opgeslagen en naar behoefte weer kan worden opgevraagd. Het moet daarbij zorgdragen voor de vereiste beschikbaarheid van de data, ook in geval van calamiteiten. Denk hierbij bijvoorbeeld aan back-ups en fail-over systemen.
- Enterprise Content Management is verantwoordelijk voor het beheer van ongestructureerde data, zoals documenten, e-mails en beeld- en geluidmateriaal. Hieronder vallen de fysieke opslag, versionering, vindbaarheid, het beheer van bewaartermijnen en ontsluiting van deze data-objecten.
- Data integration zorgt voor uitwisseling van data tussen gegevensbronnen. Dit is nodig om data uit een systeem beschikbaar te stellen aan processen, andere systemen of rapportages en analyses die deze data gebruiken. Het zorgt ervoor dat deze data beschikbaar is op de gewenste plaats op de gewenste tijd.
- Data architecture definieert op abstract niveau alle data en bijbehorende databronnen. Daarnaast specificeert deze subject area de datastromen en de processing op deze data en de technologie die hiervoor gebruikt wordt.
- Data modelling definieert de data zelf: hoe de data gestructureerd en aan elkaar gerelateerd is en wat de data betekent. Dit is nodig om de data te kunnen koppelen aan bronnen, processen en gebruikers en zo de data-architectuur te ondersteunen.
Quality (Kwaliteit)
Deze groep bevat subject area’s die ervoor zorgdragen dat de data de juiste kwaliteit heeft voor de doelstellingen van de organisatie.
- Data quality beheert de kwaliteitsdoelen en eisen die aan data gesteld worden door de belanghebbenden. Het draagt verder zorg voor governance (eigenaarschap en processen), kwaliteitsmetingen en de activiteiten om de kwaliteit op het gewenste niveau te krijgen.
- Master & Reference Data Management is verantwoordelijk voor het beheer en de juiste kwaliteit van de masterdata van de organisatie. Het regelt de verantwoordelijkheden van de business-‘objecten’ uit de echte wereld die een belangrijke rol spelen bij transacties van de organisatie, zoals klanten, producten en leveranciers. Reference Data Management zorgt voor kwaliteit en consistent gebruik van gedeelde opzoekwaarden die binnen de organisatie gebruikt worden, zoals landen- en taaltabellen. Als de kwaliteit van deze data niet op orde is heeft dit grote negatieve impact op de operatie, besluitvorming en verplichte rapportages.
Insight (Inzicht)
Deze groep bevat de subject area’s die tot belangrijkste doel hebben data te gebruiken om de business en toezichthouders inzicht te verschaffen ten behoeve van operationele, tactische en strategische besluitvorming.
- Data Warehouse & Business Intelligence is de traditionele functie die ervoor zorgt dat rapportages en dashboards worden geleverd op basis van historische data vanuit de businessprocessen en systemen. Deze leveren inzichten ter ondersteuning van data gedreven besluitvorming op strategisch, tactisch en operationeel niveau.
- Big Data & Analytics dient te worden opgedeeld in twee gebieden: Big Data en Analytics.
- Big Data betreft data die zich onderscheidt van ‘traditionele’ data in omvang, snelheid en variëteit. Denk aan grote hoeveelheden data die door sociale media worden geproduceerd, continue datastromen vanuit sensoren en andere ‘Internet-of-Things-devices’ en ongestructureerde data zoals camerabeelden en gesproken of geschreven tekst. De cloud en toegenomen prestaties van IT-systemen maken het nu mogelijk om ook deze data te verzamelen, op te slaan en te verwerken.
- Analytics is een combinatie van technologie, methoden en modellen om uit deze Big Data nieuwe inzichten te creëren. Zo is het mogelijk om verbanden te leggen die eerder niet vindbaar waren en trends te ontdekken en te formaliseren. Toepassingen zijn bijvoorbeeld het voorspellen van bepaalde ontwikkelingen, zelflerende systemen ontwikkelen en informatie herleiden uit teksten en beelden.
Opmerking
Vanuit theoretisch perspectief zijn er natuurlijk wel wat kanttekeningen te plaatsen bij deze opdeling. Subject area’s laten zich immers niet strikt scheiden en alle area’s hebben wel een relatie met de andere area’s. Zo heeft bijvoorbeeld elk van de gebieden wel te maken met een stuk beheersing, kwaliteit en inzicht. Voor een praktische kijk blijkt de geschetste opdeling echter zeer geschikt.
Vervolg
De volgende blog gaat in op de relaties tussen de subject area’s. De derde en laatste blog gaat dieper in op de functies per subject area’s.