Met een goede data architectuur natuurlijk!
Maar wat is nu een goede data architectuur en waar moet je dan allemaal aan denken?
Dit boek is een goede start om daar wat meer inzicht in te krijgen!
Een vraag waar veel bedrijven mee worstelen is hoe zij data kunnen verwaarden in hun organisatie. Een van de uitdagingen is het neerzetten van een data architectuur die aansluit bij de ambities, waarbij data uit bronsystemen gehaald wordt, opgeslagen, getransformeerd, gecleansed en beschikbaar wordt gesteld aan allerlei gebruikers voor analyse en/of operationeel gebruik.
Een boek dat interessant is om te lezen is “Deciphering Data Architectures” van James Serra. Ik heb dit boek gelezen om bij te blijven in de ontwikkelingen op het gebied van Data Architecturen. We hebben binnen SynTouch namelijk een eigen framework ontwikkeld, genaamd SIDAF (=SynTouch Integratie en Data Architectuur Framework), waarin we een visie beschrijven op het gebied van data- en integratie architectuur. Dit framework evolueert op basis van nieuwe inzichten.
Maar terug naar het boek …
Het boek geeft een overzicht van verschillende concepten bij data architecturen. De verschillende onderdelen worden niet in detail beschreven, maar het geeft een high level inzicht in de mogelijkheden. Er worden technische data architecturen besproken zoals (Modern) Data Warehouse, Data Fabric en Data Lakes, maar ook architectuur concepten zoals Data Mesh.
Overigens plaatst de auteur Data Lakes en Data Mesh op hetzelfde architectuur nivo, maar hier ben ik het niet helemaal mee eens. Ik vind Data Mesh meer een socio-technische architectuur concept en data warehouse en data lakes meer technische architecturen. Je kunt zelfs een Data Mesh architectuur neerzetten gebruikmakend van een Data Lake. Maar dat even terzijde.
Ondanks dat het een introductie is van de verschillende technieken is het wel goed om de definities bij elkaar te zien. Bijvoorbeeld het verschil tussen Operationele Data Stores, Data Marts en Data Hubs is goed om te weten om je vocabulaire op data gebied op orde te hebben. Hetzelfde geldt voor de Lambda- en Kappa architectuur.
De technische concepten worden besproken vanuit verschillende fases, die bij de opzet van een data architectuur komen kijken. Denk hierbij aan design, data modellering, data storage, data ingestion en de data architectuur zelf.
Het boek heeft een veelal technische insteek maar bij data architecturen in bredere zin is governance natuurlijk ook belangrijk. Hier is ook een kort hoofdstuk aan gewijd. Het is fijn dat concepten worden beschreven en aan het einde van het boek worden mogelijke technische implementatie platformen toegelicht.
Dit boek is een aanrader voor een data architect die op hoog nivo inzicht wil krijgen in de verschillende mogelijkheden voor een data architectuur!