De betekenis van data krijgt steeds meer aandacht. Data lineage: de herleidbaarheid van data naar zijn betekenis en de reden waarvoor de data wordt gebruikt, is steeds vaker een kritieke succesfactor. Daarnaast leidt de steeds grotere verscheidenheid van data tot de noodzaak om grip te krijgen op de afzonderlijke databronnen. Schaarste in dataspecialisten leidt tot de noodzakelijk om slimmer met data om te gaan, en beschikbare kennis te expliciteren. De invoering van een gedistribueerde data-architectuur geeft het laatste zetje om het “informatiehuis op orde” te brengen.
De verwerking van data is daarmee niet alleen een logistieke uitdaging, maar vereist ook een betrouwbare aanpak om de betekenis van data in kaart te brengen die verder gaat dan de traditionele beschrijving van de structuur van het datawarehouse: een semantische aanpak is vereist.
Deze semantische aanpak neemt de problem space als uitgangspunt voor de beschrijving: het domein waarover de data gaat. Vanuit een nauwkeurige analyse en model van het domein, volgt een herleidbare vertaling en relatie naar het model voor de data zelf in de solution space. Het resultaat kan gezien worden als een knowledge graph: een netwerk van verbonden (linked) data, inclusief de definitie van deze data en de lineage naar de grondslag voor deze data in wet- regelgeving, compliancy richtlijnen en bedrijfsdefinities.
Een dergelijke aanpak is niet alleen relevant voor het datawarehouse: het resultaat is een expliciete, eenduidige vastlegging van de kennis over de relevante data in een organisatie. Marco Brattinga neemt u mee in de wereld van enterprise semantic data management langs de volgende topics: