Het zakelijke gegevensmeer

door PBT Group | mei 24, 2021

Het zakelijke gegevensmeer

door PBT Group | mei 24, 2021 | In de media | 0 Reacties

Volgens Margaret Rouse *: “Een datameer is een grote objectgebaseerde opslagplaats die gegevens in de oorspronkelijke indeling bewaart totdat ze nodig zijn.”

Martin Rennhackkamp ** noemde het: “Een uitvergrote allesomvattende, gratis voor iedereen toegankelijke verzamelplaats.”

Eenvoudig gezegd is een datameer een grote, gemakkelijk toegankelijke landingsplaats die enorme hoeveelheden gestructureerde en ongestructureerde gegevens in hun oorspronkelijke vorm bevat.

Er zijn veel beschrijvingen met verschillende vertellingen over waarom het datameer tot stand is gekomen. Laten we proberen deze motivaties te verzamelen uit verschillende beschrijvingen met als doel het technische jargon te omzeilen.

Het publiek

Datawetenschappers, analisten (super / technische gebruikers) en ontwikkelaars waren de belangrijkste beoogde begunstigden van de Data Lake-uitvinding. Het datameer speelt in op hun behoefte aan “snelle en elastische” datatoegang zonder de obstakels van datawarehouse (DWH) bureaucratie. Het biedt hen ook de mogelijkheid om met andere soorten gegevens (ongestructureerd) om te gaan die voorheen een uitdaging vormden voor het DWH-ecosysteem.

In de afgelopen jaren is de datameer-innovatie getuige van acceptatie buiten het beoogde publiek, wat de uitdaging vormt voor de technologiestack om beginnende en niet-technische gebruikers te ondersteunen.

De opname van de beginnende gebruikers blijft nog steeds een gebied dat verbetering verdient op het gebied van het aanbieden van gebruiksvriendelijke tools voor het delven van deze datameren.

Ongestructureerde data

Het datameer is vanaf de basis opgebouwd als een big data-oplossing, waarbij ongestructureerde data nog steeds wordt beschouwd als data met een geldig paspoort om in het data lake-ecosysteem te leven.

Het datameer is synoniem voor big data, met zijn warme gastvrijheid voor zowel gestructureerde als ongestructureerde data, waardoor de noodzaak voor gebruikers wordt verlicht om tussen omgevingen te schakelen om nieuwe en uniforme vormen van zakelijke waarde te doorbreken die worden beloofd door het ‘heilige huwelijk’ van gestructureerde en ongestructureerde data .

Het datameer ontstond als reactie op nieuwe soorten gegevens (video, audio, afbeeldingen, tekstbestanden, binair, enz.) Die moesten worden vastgelegd en geoogst voor verrijkte bedrijfsinzichten en concurrentievoordeel.

Snelle gegevensoverdracht

De benadering van het gewoon dumpen van informatie “zoals het is” in het datameer, zet de krachtige en tijdrovende technische complexiteit die in het DNA van het datawarehouse is gegraveerd, opzij. Hierdoor kunnen gegevens beschikbaar worden gemaakt voor zakelijk gebruik. Hoewel het technische aspect losstaat van de stappen voor het opnemen van gegevens, worden ze verplaatst naar een stap die vaak “distillatie” wordt genoemd.

Het datameer staat synoniem voor big data, met zijn warme gastvrijheid voor zowel gestructureerde als ongestructureerde data.

Destillatie kan worden benaderd in cyclische iteraties, naargelang en wanneer de gegevens moeten worden gebruikt. In deze stap maken de zakelijke gebruikers kaart (en) tegen de gegevens in het meer om de weergave van de gegevens te genereren die aan hun onmiddellijke vereisten voldoen. Het in kaart brengen neemt een fractie van de tijd in beslag vanwege het idee om te focussen op de onmiddellijke en specifieke vereisten. Met andere woorden, de structuur en interpretatie van de gegevens wordt alleen gedaan wanneer deze worden gebruikt – dit wordt “schema bij lezen” genoemd, in tegenstelling tot de “schema bij schrijven” -benadering die wordt gebruikt bij datawarehousing.

De kosten

Alle data lake-beschrijvingen hebben een aantal kosten-batenargumenten en ze lijken allemaal mee te gaan met de golf van sterk dalende opslagkosten. Ze omarmen verder het concept van een snelle doorlooptijd en een onmiddellijk rendement op investeringen, met de voordelen van klein beginnen en naar behoefte opschalen. Anderen noemen de cyclische benadering die het mogelijk maakt om de kosten over de bedrijfsonderdelen te verdelen op het moment dat de gegevens worden gebruikt.

Al het bovenstaande is waar, totdat de gegevens in het meer zijn opgenomen. De data-exploratietechnologie blijft echter nog steeds een gebied van “onbekende kosten”, voornamelijk vanwege de lage volwassenheid in de technologie / applicaties die de data kunnen ondervragen.

De term datameer wordt geaccepteerd als een manier om een grote datapool te beschrijven waarin het schema / de structuur en de gegevensvereisten pas worden gedefinieerd als de gegevens worden opgevraagd. De innovatie culmineerde in de honger naar snelle gegevenstoegang door technische teams om alle soorten gegevenstypen te verkennen. Het datameer staat bekend als een kosteneffectieve oplossing op een manier die gebruikmaakt van de zakelijke behoefte aan lokale inzichten.

Zoals Rennhackkamp zegt: “Als het datameer correct wordt gebruikt in het BI-ecosysteem en het datawarehouse wordt gebruikt voor datgene waar het op zijn beurt goed voor is, kan men een synergetisch uitgebreid BI-ecosysteem hebben dat echt goede informatie en inzichten voor het bedrijf waar en wanneer dat nodig is. ”

Krediet: ITWEB

Het zakelijke gegevensmeer

Het zakelijke gegevensmeer

Categories

Featured News

Archives

Related Articles

Deel 1: Systeemeigenaren zijn de sleutel in data-analyseprojecten

Geen AI zonder AI-team

MVP in gegevensbeheer

Datagestuurde beslissingen mogelijk maken met dataproducten

Data-engineering klaar voor AI-verandering

Hoe gegevens en mensen bedrijfsgroei kunnen stimuleren

Gegevensbeheer in het tijdperk van AI – BBrief

De belangrijkste principes van een strategie voor data governance

Hoe AI kan helpen bij data governance

Eigenaren van bronsystemen van vitaal belang in projecten voor gegevensanalyse – ITWeb