Wat is Data Mining?
Datamining is een proces dat door bedrijven wordt gebruikt om ruwe gegevens om te zetten in bruikbare informatie. Door software te gebruiken om patronen te zoeken in grote hoeveelheden gegevens, kunnen bedrijven meer te weten komen over hun klanten om effectievere marketingstrategieën te ontwikkelen, de verkoop te verhogen en de kosten te verlagen. Datamining is afhankelijk van effectieve gegevensverzameling, opslag en computerverwerking.
Dataminingprocessen worden gebruikt om modellen voor machinaal leren te bouwen die de basis vormen voor toepassingen als zoekmachinetechnologie en aanbevelingsprogramma’s voor websites.
Hoe datamining werkt
Datamining bestaat uit het onderzoeken en analyseren van grote informatieblokken om zinvolle patronen en trends te ontdekken. Het kan op verschillende manieren worden gebruikt, bijvoorbeeld voor databasemarketing, kredietrisicobeheer, fraudedetectie, spamfiltering van e-mail of zelfs om het sentiment of de mening van gebruikers te achterhalen.
Het dataminingproces valt uiteen in vijf stappen. Eerst verzamelen organisaties gegevens en laden deze in hun data warehouses. Vervolgens worden de gegevens opgeslagen en beheerd, hetzij op interne servers, hetzij in de cloud. Bedrijfsanalisten, managementteams en informatietechnologieprofessionals krijgen toegang tot de gegevens en bepalen hoe ze deze willen ordenen. Vervolgens sorteert toepassingssoftware de gegevens op basis van de resultaten van de gebruiker, en ten slotte presenteert de eindgebruiker de gegevens in een gemakkelijk te delen formaat, zoals een grafiek of tabel.
Data Warehousing and Mining Software
Dataminingprogramma’s analyseren relaties en patronen in gegevens op basis van wat gebruikers vragen. Een bedrijf kan datamining-software bijvoorbeeld gebruiken om klassen van informatie te creëren. Ter illustratie: stel dat een restaurant datamining wil gebruiken om te bepalen wanneer het bepaalde specials moet aanbieden. Het kijkt naar de informatie die het heeft verzameld en maakt klassen op basis van wanneer klanten langskomen en wat ze bestellen.
In andere gevallen vinden dataminingers clusters van informatie op basis van logische relaties of kijken ze naar associaties en opeenvolgende patronen om conclusies te trekken over trends in consumentengedrag.
Warehousing is een belangrijk aspect van datamining. Van warehousing is sprake wanneer bedrijven hun gegevens centraliseren in één database of programma. Met een data warehouse kan een organisatie segmenten van de gegevens afsplitsen voor specifieke gebruikers om deze te analyseren en te gebruiken.
In andere gevallen kunnen analisten echter beginnen met de gegevens die zij willen hebben en een data warehouse creëren op basis van die specificaties. Hoe bedrijven en andere entiteiten hun gegevens ook organiseren, ze gebruiken ze ter ondersteuning van de besluitvormingsprocessen van het management.
Voorbeeld van datamining
Winkels zijn bekende gebruikers van dataminingtechnieken. Veel supermarkten bieden hun klanten gratis klantenkaarten aan die toegang geven tot gereduceerde prijzen die niet beschikbaar zijn voor niet-leden. Met deze kaarten kunnen winkels gemakkelijk nagaan wie wat koopt, wanneer en tegen welke prijs. Na analyse van de gegevens kunnen winkels deze gegevens vervolgens gebruiken om klanten coupons aan te bieden die zijn afgestemd op hun koopgedrag en om te beslissen wanneer ze artikelen in de uitverkoop doen of tegen de volle prijs verkopen.
Datamining kan een bron van zorg zijn wanneer een bedrijf alleen geselecteerde informatie gebruikt, die niet representatief is voor de totale steekproefgroep, om een bepaalde hypothese te bewijzen.
Key Takeaways
- Datamining is het proces waarbij een grote hoeveelheid informatie wordt geanalyseerd om trends en patronen te ontdekken.
- Datamining kan door bedrijven worden gebruikt voor alles van het leren over waar klanten in geïnteresseerd zijn of wat ze willen kopen tot het opsporen van fraude en het filteren van spam.
- Dataminingprogramma’s ontleden patronen en verbanden in gegevens op basis van de informatie die gebruikers opvragen of verstrekken.