Hoe Entity Resolution waarde toevoegt aan uw marketingprocessen

Wat is entiteitsresolutie in marketinggegevens?

Een groot aantal B2B-marketeers – bijna 27% – geeft dat toe onvoldoende data heeft hen 10% gekost, of in sommige gevallen zelfs meer in jaarlijkse inkomstenverliezen.

Dit benadrukt duidelijk een belangrijk probleem waarmee de meeste marketeers tegenwoordig worden geconfronteerd, namelijk: slechte gegevenskwaliteit. Onvolledige, ontbrekende of slechte gegevens kunnen een enorme impact hebben op het succes van uw marketingprocessen. Dit gebeurt omdat bijna alle afdelingsprocessen bij een bedrijf – maar met name sales en marketing – sterk worden gevoed door organisatiegegevens.

Of het nu gaat om een ​​compleet 360-beeld van uw klanten, leads of prospects, of andere informatie met betrekking tot producten, serviceaanbiedingen of adreslocaties - bij marketing komt het allemaal samen. Dit is de reden waarom marketeers het meest te lijden hebben wanneer een bedrijf niet de juiste kaders voor gegevenskwaliteitsbeheer gebruikt voor continue gegevensprofilering en vaststelling van gegevenskwaliteit.

In deze blog wil ik aandacht vragen voor het meest voorkomende datakwaliteitsprobleem en hoe dit van invloed is op uw kritische marketingprocessen; dan kijken we naar een mogelijke oplossing voor dit probleem en tot slot kijken we hoe we dit continu kunnen vaststellen.

Dus laten we beginnen!

Grootste probleem met gegevenskwaliteit waarmee marketeers worden geconfronteerd

Hoewel een slechte gegevenskwaliteit een lange lijst met problemen veroorzaakt voor marketeers bij een bedrijf, maar omdat we gegevensoplossingen hebben geleverd aan meer dan 100 klanten, is het meest voorkomende probleem met de gegevenskwaliteit waarmee we mensen hebben gezien:

Een enkel beeld krijgen van de belangrijkste gegevensactiva.

Dit probleem doet zich voor wanneer dubbele records voor dezelfde entiteit worden opgeslagen. Hier kan de term entiteit alles betekenen. Op het gebied van marketing kan het woord entiteit meestal verwijzen naar: klant, lead, prospect, product, locatie of iets anders dat essentieel is voor de uitvoering van uw marketingactiviteiten.

De impact van dubbele records op uw marketingprocessen

De aanwezigheid van dubbele records in datasets die voor marketingdoeleinden worden gebruikt, kan voor elke marketeer een nachtmerrie zijn. Als u dubbele records heeft, volgen enkele ernstige scenario's die u kunt tegenkomen:

  • Verspilde tijd, budget en moeite – Aangezien uw dataset meerdere records voor dezelfde entiteit bevat, kunt u uiteindelijk meerdere keren tijd, budget en inspanningen investeren voor dezelfde klant, prospect of lead.
  • Kan geen gepersonaliseerde ervaringen faciliteren – Dubbele records bevatten vaak verschillende delen van informatie over een entiteit. Als u marketingcampagnes heeft uitgevoerd met een onvolledig beeld van uw klanten, kunt u ervoor zorgen dat uw klanten zich ongehoord of onbegrepen voelen.
  • Onnauwkeurige marketingrapporten – Met dubbele gegevensrecords kunt u uiteindelijk een onnauwkeurig beeld krijgen van uw marketinginspanningen en hun rendement. U hebt bijvoorbeeld 100 leads gemaild, maar alleen reacties van 10 ontvangen - het kan zijn dat slechts 80 van die 100 uniek waren en de rest van de 20 duplicaten waren.
  • Verminderde operationele efficiëntie en productiviteit van medewerkers – Wanneer teamleden gegevens voor een bepaalde entiteit ophalen en meerdere records vinden die in verschillende bronnen zijn opgeslagen of in de loop van de tijd in dezelfde bron zijn verzameld, fungeert dit als een enorme wegversperring in de productiviteit van werknemers. Als dit vrij vaak gebeurt, heeft dit een merkbaar effect op de operationele efficiëntie van een hele organisatie.
  • Kan geen correcte conversietoeschrijving uitvoeren – Als u elke keer dat ze uw sociale kanalen of website bezochten dezelfde bezoeker als een nieuwe entiteit heeft geregistreerd, wordt het bijna onmogelijk voor u om nauwkeurige conversietoeschrijving uit te voeren en weet u precies welk pad de bezoeker heeft gevolgd naar conversie.
  • Niet-bezorgde fysieke en elektronische post – Dit is het meest voorkomende gevolg van dubbele records. Zoals eerder vermeld, bevat elk duplicaatrecord meestal een gedeeltelijk beeld van de entiteit (daarom zijn de records in de eerste plaats als duplicaten in uw dataset terechtgekomen). Om deze reden kunnen in bepaalde records fysieke locaties of contactgegevens ontbreken, waardoor e-mails niet kunnen worden bezorgd.

Wat is Entiteitsresolutie?

Entiteit resolutie (ER) is het proces om te bepalen wanneer verwijzingen naar real-world entiteiten gelijkwaardig zijn (dezelfde entiteit) of niet gelijkwaardig (verschillende entiteiten). Met andere woorden, het is het proces van het identificeren en koppelen van meerdere records aan dezelfde entiteit wanneer de records anders worden beschreven en vice versa.

Entiteitsresolutie en informatiekwaliteit door John R. Talburt

Entiteitsresolutie implementeren in uw marketingdatasets

Na de verschrikkelijke impact van duplicaten op het succes van uw marketingactiviteiten te hebben gezien, is het absoluut noodzakelijk om een ​​eenvoudige, maar krachtige methode te hebben om uw datasets ontdubbelen. Dit is waar het proces van entiteit resolutie komt binnen. Eenvoudigweg verwijst entiteitsresolutie naar het proces van het identificeren welke records tot dezelfde entiteit behoren.

Afhankelijk van de complexiteit en de staat van kwaliteit van uw datasets, kan dit proces een aantal stappen bevatten. Ik ga je door elke stap van dit proces leiden, zodat je begrijpt wat het precies inhoudt.

Opmerking: ik zal de algemene term 'entiteit' gebruiken bij het beschrijven van het proces hieronder. Maar hetzelfde proces is van toepassing en mogelijk voor elke entiteit die betrokken is bij uw marketingproces, zoals klant, lead, prospect, locatieadres, enz.

Stappen in het proces voor het oplossen van entiteiten

  1. Gegevensrecords van entiteiten verzamelen die zich in verschillende gegevensbronnen bevinden – Dit is de eerste en belangrijkste stap van het proces, waarin u identificeert WAAR precies de entiteitsrecords worden opgeslagen. Dit kunnen gegevens zijn die afkomstig zijn van advertenties op sociale media, websiteverkeer of handmatig zijn ingevoerd door verkopers of marketingpersoneel. Zodra de bronnen zijn geïdentificeerd, moeten alle records op één plek worden samengebracht.
  2. Gecombineerde records profileren – Zodra de records zijn samengebracht in één dataset, is het nu tijd om de gegevens te begrijpen en de verborgen details over de structuur en inhoud ervan te ontdekken. Met gegevensprofilering worden uw gegevens statistisch geanalyseerd en wordt nagegaan of gegevenswaarden onvolledig of leeg zijn of een ongeldig patroon en formaat volgen. Door uw dataset te profileren, worden andere dergelijke details blootgelegd en worden potentiële mogelijkheden voor het opschonen van gegevens aan het licht gebracht.
  3. Gegevensrecords opschonen en standaardiseren – Een diepgaand gegevensprofiel geeft u een bruikbare lijst met items voor het opschonen en standaardiseren van uw dataset. Dit kan stappen omvatten om ontbrekende gegevens in te vullen, gegevenstypen te corrigeren, patronen en formaten te corrigeren, evenals het ontleden van complexe velden in subelementen voor een betere gegevensanalyse.
  4. Records die tot dezelfde entiteit behoren, matchen en koppelen – Nu zijn uw gegevensrecords klaar om te worden gematcht en gekoppeld, en vervolgens af te ronden welke records tot dezelfde entiteit behoren. Dit proces wordt meestal gedaan door het implementeren van industriële of eigen matching-algoritmen die ofwel een exacte match uitvoeren op uniek identificerende attributen, ofwel een fuzzy match uitvoeren op een combinatie van attributen van een entiteit. Als de resultaten van het matching-algoritme onnauwkeurig zijn of valse positieven bevatten, moet u het algoritme mogelijk verfijnen of handmatig onjuiste matches markeren als duplicaten of niet-duplicaten.
  5. Regels implementeren voor het samenvoegen van entiteiten tot gouden records - Dit is waar de laatste samenvoeging plaatsvindt. U wilt waarschijnlijk geen gegevens verliezen over een entiteit die is opgeslagen in records, dus deze stap gaat over het configureren van regels om te beslissen:
    • Welk record is het stamrecord en waar zijn de duplicaten?
    • Welke attributen van duplicaten wilt u naar het stamrecord kopiëren?

Zodra deze regels zijn geconfigureerd en geïmplementeerd, is de uitvoer een set gouden records van uw entiteiten.

Een doorlopend kader voor entiteitsafwikkeling tot stand brengen

Hoewel we een eenvoudige stapsgewijze handleiding hebben doorlopen voor het oplossen van entiteiten in een marketingdataset, is het belangrijk om te begrijpen dat dit moet worden behandeld als een doorlopend proces in uw organisatie. Bedrijven die investeren in het begrijpen van hun data en het oplossen van de belangrijkste kwaliteitsproblemen, gaan een veel veelbelovendere groei tegemoet.

Voor een snelle en eenvoudigere implementatie van dergelijke processen, kunt u data-operators of zelfs marketeers in uw bedrijf ook voorzien van gebruiksvriendelijke software voor het oplossen van entiteiten, die hen door de bovengenoemde stappen kan leiden.

Concluderend kunnen we gerust stellen dat een dataset zonder duplicaat een cruciale speler is bij het maximaliseren van de ROI van marketingactiviteiten en het versterken van de merkreputatie via alle marketingkanalen.