Download

Download
0
2.3k
Channel: Data

Data preparation, de vijf belangrijkste principes

Het landschap van analytics technologie is de laatste jaren geëvolueerd en drastisch veranderd. De grootste verandering is de opkomst van nieuwe processen en technologie die je informeren hoe je data is opgeslagen en wordt verwerkt. Eén van de belangrijkste motieven voor deze verandering was een verhoogde focus op het verbeteren van de toegankelijkheid van gegevens.

Dit heeft geleid tot een verschuiving van rigide, door IT geleide processen naar een model dat voorrang geeft aan zelfredzaamheid en samenwerking met IT. Het samenbrengen van verschillende datapunten is steeds belangrijker geworden voor het maken van geavanceerde analyses. Hoe zorg je ervoor dat je data opgeschoond en gereed is voor analyse?

Data preparation, de vijf belangrijkste principes

Naarmate er nieuwe platformen voor data preparation ontstaan om dit op te lossen, brengen ze nieuwe organisatieprocessen met zich mee voor hoe gegevens worden opgeschoond en gereedgemaakt voor analyse. Deze whitepaper biedt handvatten en gaat in op:

  • Het belang van opgeschoonde data.
  • Selectiecriteria voor moderne data-oplossingen.
  • De vijf basisprincipes van goede data preparation.
Data preparation staat in de kinderschoenen

De traditionele benadering van data preparation zijn tijdrovend en vergen veel van je resources. Uit cijfers van Glassdoor en IDC blijkt dat bedrijven wereldwijd meer dan 450 miljard dollar investeren in gegevensvoorbereiding. Uit onderzoek van Trifacta blijkt dat zestig procent van de IT-professionals de helft of meer van hun tijd besteedt aan het borgen van de datakwaliteit, het opschonen van data of het gereedmaken van data voor analyse. 92 procent van de IT-professionals en data-analisten geeft aan liever iets anders doen dan gegevensvoorbereiding en zestig procent vindt zichzelf overgekwalificeerd voor deze werkzaamheden.

De opkomst van data preparation platformen

IT-ers moeten niet langer in de lead zijn voor het opschonen en voorbereiden van data voor analyse. Dit moet gedaan worden door degenen die de data begrijpen en weten hoe ze het potentieel het beste kunnen benutten. Voorheen was dit vervelend en tijdrovend werk. Door de opkomst van data preparation platformen wordt dit proces efficiënter en sneller.

Steeds meer organisaties automatiseren het merendeel van hun handmatige processen en handelingen. Organisaties erkennen steeds meer behoefte te hebben aan geautomatiseerde benaderingen die de eindgebruiker – de analist – de handvatten bieden om het data preparation proces te standaardiseren en te optimaliseren.

De vijf basisprincipes van goede data preparation

We gaan naar een nieuwe standaard in data-analyse, wat betekent dat we een geheel nieuwe aanpak hanteren voor de standaardisatie en opschoning van gegevens voor analytisch gebruik. Daarom heeft Trifacta het Clean Data Manifesto ontwikkeld. Als onderdeel van dit manifest zijn er vijf principes voor goede data preparation geïdentificeerd:

  1. Prioriteiten en targets bepalen.
  2. Het identificeren van issues.
  3. Collaboratieve curatie.
  4. Continue monitoring.
  5. Zorg voor transparantie.

Jessica Benton