Ontdubbeling: best practices voor het vermijden of corrigeren van dubbele klantgegevens

Best practices voor gegevensontdubbeling voor CRM

Dubbele gegevens verminderen niet alleen de nauwkeurigheid van zakelijke inzichten, maar brengen ook de kwaliteit van uw klantervaring in gevaar. Hoewel iedereen met de gevolgen van dubbele gegevens wordt geconfronteerd - IT-managers, zakelijke gebruikers, gegevensanalisten - heeft dit de grootste impact op de marketingactiviteiten van een bedrijf. Aangezien marketeers het product- en serviceaanbod van het bedrijf in de branche vertegenwoordigen, kunnen slechte gegevens snel uw merkreputatie aantasten en leiden tot het leveren van negatieve klantervaringen. Dubbele gegevens in de CRM van het bedrijf vinden plaats om verschillende redenen.

Van een menselijke fout tot het verstrekken van iets andere informatie door klanten op verschillende tijdstippen in de organisatiedatabase. Een consument noemt zijn naam bijvoorbeeld Jonathan Smith op het ene formulier en Jon Smith op het andere. De uitdaging wordt verergerd door een groeiende database. Het wordt voor beheerders vaak steeds moeilijker om DB bij te houden en ook om de relevante gegevens bij te houden. Het wordt steeds uitdagender om ervoor te zorgen dat de database van de organisatie accuraat blijft ”.

Natik Ameen, Marketing Expert bij Canz Marketing

In dit artikel zullen we kijken naar de verschillende soorten dubbele gegevens en enkele nuttige strategieën die marketeers kunnen gebruiken om hun bedrijfsdatabases te ontdubbelen.

Verschillende soorten dubbele gegevens

Dubbele gegevens worden meestal uitgelegd als een kopie van het origineel. Maar er zijn verschillende soorten dubbele gegevens die dit probleem complexer maken.

  1. Exacte duplicaten in dezelfde bron - Dit gebeurt wanneer records uit de ene gegevensbron worden overgebracht naar een andere gegevensbron zonder rekening te houden met matching- of samenvoegingstechnieken. Een voorbeeld is het kopiëren van informatie uit CRM naar een e-mailmarketingtool. Als uw klant zich op uw nieuwsbrief heeft geabonneerd, is zijn record al aanwezig in de e-mailmarketingtool, en als u gegevens van CRM naar de tool overbrengt, worden dubbele kopieën van dezelfde entiteit gemaakt. 
  2. Exacte duplicaten in meerdere bronnen - Exacte duplicaten in meerdere bronnen ontstaan ​​meestal door gegevensback-upinitiatieven bij een bedrijf. Organisaties hebben de neiging zich te verzetten tegen het opschonen van gegevens en zijn geneigd alle kopieën van gegevens die ze bij de hand hebben, op te slaan. Dit leidt tot ongelijksoortige bronnen met dubbele informatie.
  3. Verschillende duplicaten in meerdere bronnen - Er kunnen ook duplicaten zijn met verschillende informatie. Dit gebeurt meestal wanneer klanten wijzigingen ondergaan in achternaam, functietitel, bedrijf, e-mailadres, enz. En aangezien er opmerkelijke verschillen zijn tussen oude en nieuwe records, wordt de binnenkomende informatie behandeld als een nieuwe entiteit.
  4. Niet-exacte duplicaten in dezelfde of meerdere bronnen - Een niet-exact duplicaat is wanneer een gegevenswaarde hetzelfde betekent, maar op verschillende manieren wordt weergegeven. De naam Dona Jane Ruth kan bijvoorbeeld worden opgeslagen als Dona J. Ruth of DJ Ruth. Alle gegevenswaarden vertegenwoordigen hetzelfde, maar wanneer ze worden vergeleken door middel van eenvoudige gegevensafstemmingstechnieken, worden ze als niet-overeenkomsten beschouwd.

Ontdubbeling kan een zeer complex proces zijn, aangezien consumenten en bedrijven hun contactgegevens in de loop van de tijd vaak wijzigen. Er is een verschil in de manier waarop ze elk gegevensveld invoeren - van hun naam, e-mailadres (sen), woonadres, bedrijfsadres, enz.

Hier is een lijst met 5 best practices voor gegevensontdubbeling die marketeers vandaag kunnen gaan gebruiken.

Strategie 1: laat validatiecontroles uitvoeren bij gegevensinvoer

U moet strikte validatiecontroles hebben op alle gegevensinvoersites. Dit houdt in dat ervoor moet worden gezorgd dat de invoergegevens voldoen aan het vereiste gegevenstype, het vereiste formaat en tussen acceptabele bereiken liggen. Dit kan een grote bijdrage leveren aan het compleet, geldig en nauwkeurig maken van uw gegevens. Bovendien is het van cruciaal belang dat uw workflow voor gegevensinvoer niet alleen is geconfigureerd om nieuwe records te maken, maar eerst zoekt en vindt of de dataset een bestaand record bevat dat overeenkomt met het inkomende record. En in dergelijke gevallen wordt het alleen gevonden en bijgewerkt, in plaats van een nieuw record te maken. Veel bedrijven hebben controles voor de klant ingebouwd om ook hun eigen dubbele gegevens op te lossen.

Strategie 2: Voer deduplicatie uit met geautomatiseerde tools

Gebruik zelfbediening software voor gegevensontdubbeling die u kunnen helpen bij het identificeren en opschonen van dubbele records. Deze tools kunnen gegevens standaardiseren, nauwkeurig exacte en niet-exacte overeenkomsten vinden, en ze verminderen ook het handmatige werk van het doorzoeken van duizenden rijen met gegevens. Zorg ervoor dat de tool ondersteuning biedt voor het importeren van gegevens uit een breed scala aan bronnen, zoals Excel-sheets, CRM-database, lijsten, enz.

Strategie 3: gebruik gegevensspecifieke deduplicatietechnieken

Afhankelijk van de aard van de gegevens wordt gegevensontdubbeling anders uitgevoerd. Marketeers moeten voorzichtig zijn bij het ontdubbelen van gegevens, omdat hetzelfde iets anders kan betekenen voor verschillende gegevensattributen. Als bijvoorbeeld twee gegevensrecords overeenkomen op een e-mailadres, is de kans groot dat het duplicaten zijn. Maar als twee records overeenkomen op adres, is het niet noodzakelijk een duplicaat, omdat twee personen die tot hetzelfde huishouden behoren, afzonderlijke abonnementen kunnen hebben bij uw bedrijf. Zorg er dus voor dat u activiteiten voor gegevensontdubbeling, samenvoegen en opschonen implementeert op basis van het soort gegevens dat uw gegevenssets bevatten.

Strategie 4: bereik het gouden masterrecord door gegevensverrijking

Nadat u de lijst met overeenkomsten in uw database heeft bepaald, is het cruciaal om deze informatie te analyseren voordat beslissingen kunnen worden genomen over het samenvoegen of opschonen van gegevens. Als er meerdere records bestaan ​​voor een enkele entiteit en sommige vertegenwoordigen onnauwkeurige informatie, dan is het het beste om die records op te schonen. Aan de andere kant, als duplicaten onvolledig zijn, is het samenvoegen van gegevens een betere keuze, omdat het gegevensverrijking mogelijk maakt, en samengevoegde records kunnen meer waarde toevoegen aan uw bedrijf. 

Hoe dan ook, marketeers moeten eraan werken om één enkel beeld van hun marketinginformatie te krijgen, de zogenaamde gouden meesterrecord.

Strategie 5: Monitor gegevenskwaliteitsindicatoren

Een voortdurende inspanning om uw gegevens schoon en ontdubbeld te houden, is de beste manier om uw strategie voor gegevensontdubbeling uit te voeren. Een tool die dataprofilering en kwaliteitsmanagementfuncties biedt, kan hier goed van pas komen. Het is absoluut noodzakelijk voor marketeers om in de gaten te houden hoe nauwkeurig, geldig, volledig, uniek en consistent de gegevens zijn die worden gebruikt voor marketingactiviteiten.

Omdat organisaties data-applicaties blijven toevoegen aan hun bedrijfsprocessen, is het voor elke marketeer noodzakelijk geworden om data-deduplicatiestrategieën te hebben. Initiatief zoals het gebruik van tools voor gegevensontdubbeling en het ontwerpen van betere validatieworkflows voor het maken en bijwerken van gegevensrecords zijn enkele cruciale strategieën die een betrouwbare gegevenskwaliteit in uw organisatie mogelijk kunnen maken.

Over dataladder

Data Ladder is een datakwaliteitsbeheerplatform dat bedrijven helpt bij het opschonen, categoriseren, standaardiseren, ontdubbelen, profileren en verrijken van hun data. Onze toonaangevende software voor het matchen van gegevens helpt u bij het vinden van overeenkomende records, het samenvoegen van gegevens en het verwijderen van duplicaten met behulp van intelligente algoritmen voor fuzzy matching en machine learning, ongeacht waar uw gegevens zich bevinden en in welk formaat.

Download een gratis proefversie van Data Ladder's Data Matching Software

Wat denk je?

Deze site gebruikt Akismet om spam te verminderen. Ontdek hoe uw reactiegegevens worden verwerkt.