IT Systems 3/2018 CRM systémy AI a Business Intelligence 27. 4. 2018 12:18

Jak připravit data z CRM systému

aneb praktický příklad využití data miningu pro CRM

ACREA CRM je v každé společnosti. Pro někoho má „lidskou podobu“ vzájemného kontaktu se zákazníkem. Jedná se o proces péče o zákazníka, který může mít různé formy a podoby. Jiným, mě nevyjímaje, se spíše vybaví jeho softwarová podoba, sloužící pro formální a věcné zaznamenání tohoto procesu. Do CRM data nezaznamenáváme jenom proto, aby byla zaznamenána, ale hlavně proto, abychom je pak dále obchodně využili a mohli na nich postavit další rozhodovací proces, případně je využili v jiných firemních aktivitách. Před několika měsíci mě kolegyně požádala, abych pro ni z našeho firemního CRM připravil data o zákaznících do e-mailových kampaní. Trpce jsem se usmál a v duchu si říkal, proč si to neudělá sama. Shovívavě, a jak se později ukázalo, hodně naivně, jsem si na to vyčlenil jedno dopoledne a pustil se do práce.

Webové rozhraní pro zadání informací do CRM zná skoro každý. Podle použitého CRM se může lišit, ale v podstatě se vždy jedná o sadu různých webových formulářů. S rozhraním pro výstup dat ze CRM je to složitější. Různá CRM mají různé možnosti exportu dat. Některá pohříchu nemají žádné, jiná pouze omezené. Co dělat v případě, že potřebujeme data dostat ven a nemáme k tomu žádné vhodné prostředky přímo v CRM? Pomoci může data mining.

Poznej svého (ne)přítele

Po prvním seznámení se s rozhraním CRM, které jsem do té doby znal a prakticky používal pouze k evidenci své pracovní docházky, jsem pochopil, že jeho možnosti uživatelsky jednoduchého a příjemného exportu jsou minimální. Jednoduše tedy data v požadovaném rozsahu a struktuře z našeho CRM vyexportovat nepůjdou. Jedinou možností proto bylo jít hlouběji a pokusit se data vyextrahovat z původního SQL úložiště. K tomu však je nutná znalost vnitřních vazeb a datové struktury a tu jsem bohužel neměl. Datový model k CRM neexistoval, takže bylo třeba nejprve pochopit, jak jsou data vnitřně uspořádána a kde a jak je uloženo to, co chceme vyexportovat.

Obr. 1: Ukázka relačních vztahů v jedné dílčí oblasti CRM, obchodních aktivit

Pochopení vnitřní struktury pak trvalo asi týden, za značné podpory kolegy, který s vnitřním uspořádáním už měl nějaké zkušenosti. Bylo zřejmé, že se nebude jednat o nějaký rychlý export, ale o zdlouhavý proces poznání, přípravy a následné automatizace. Co mělo trvat hodiny, začínalo trvat týdny. Uvědomil jsem si, že ačkoli se nakonec budou provádět elementární výběry, naštěstí podle jasně definovaných business pravidel od mé kolegyně, tak v podstatě se jedná o klasickou dataminingovou úlohu. A jako k takové jsem k ní od začátku přistoupil. Prošel jsem klíčové fáze porozumění úloze a datům (data byla určitě složitější), abych pak přibližně 80 % času věnoval datovým úpravám. Pro řešení této úlohy jsem si vybral můj oblíbený dataminingový nástroj – IBM SPSS Modeler.

V souvislosti s data miningem panuje celá řada mýtů. Například, že data mining pracuje pouze s obrovskými objemy dat nebo že data mining je pouze sada různých predikčních algoritmů. Bohužel neexistuje jednotná, všeobecně platná definice. Problém je naopak v tom, že definic je příliš mnoho. Přidám tedy svoji vlastní. Data mining je proces celé řady úkonů od načtení dat, typicky z různých datových formátů, přes jejich transformaci a manipulaci s nimi, až po určené výstupy. Tomuto procesu však musí předcházet jasné pochopení dané problematiky, nástin řešení a definice metrik, podle kterých se dosažené výsledky budou evaluovat. V tomto procesu se sice velice často používají i predikční algoritmy a modely, ale z vlastní zkušenosti mohu říci, že celá řada projektů je čistě datová. Založená na tom, že je potřeba data odněkud načíst, zpracovat a někam uložit. Žádné predikce, žádné složité algoritmy často nejsou nutné. Objem dat rovněž není rozhodující. Úlohu řešíme stejně, ať už pracujeme s daty v řádu menších desetitisíců, jako v mém případě, nebo s miliony zákazníků a stamiliony transakcí. Oba typy projektů jsem řešil a datové posloupnosti, které jsem vytvářel, byly velice podobné.

Trnitá cesta k datům

Pro data mining obecně můžete použít celou řadu nástrojů. Co by však daný nástroj měl bezpodmínečně nabídnout, je široké spektrum funkcí pro práci a manipulaci s daty. Ve fázi přípravy dat je třeba data pospojovat z různých zdrojů (tabulek a číselníků), často i z různých formátů, a provést celou řadu manipulací a transformací. V mém případě se totiž ukázalo, že některé transakční údaje byly v datech vtipně uloženy v textových řetězcích bez zjevné struktury, které bylo nutno nejprve rozdělit, reklasifikovat a restrukturalizovat. Mým hlavním zdrojem byly informace o zákaznících z jedné konkrétní databázové tabulky obsahující informace o osobách a firmách. K ní však bylo třeba připojit asi 20 dalších číselníků. Samotné záznamy o osobách bylo nutné připojit přes sadu různých cizích klíčů k jejich mateřským společnostem, případně menším organizačním jednotkám – fakultám či katedrám. Z jiných tabulek jsem pak ke konkrétním osobám připojoval informace o zakoupeném softwaru a absolvovaných kurzech.

Podobně jsem na tom byl i s daty z externích zdrojů (typicky excelovské soubory), které si kolegyně vedly o svých zákaznících, účastnících kurzů naše Centra výuky. To poskytuje různé kurzy z oblasti statistiky, data miningu a marketingu. Tyto transakční záznamy byly uloženy v několika excelovských souborech z dřevních dob, kdy se ještě nepoužívalo CRM. Tak jak se měnili lidé, kteří data zaznamenávali, tak se bohužel měnila i kvalita a struktura zápisu. V rámci řešení jsem tedy musel jednorázově konsolidovat tato historická data, abych pak mohl řešit další problém, jak je napojit na aktuální data ze CRM. K tomu jsem použil jediné společné textové řetězce, které byly k dispozici – jména a e-mailové adresy, díky kterým se naštěstí podařilo spojit asi 97 % případů. Historická data pak byla převedena a agregována na úroveň osoby a byly k nim připojeny nové záznamy o absolvovaných kurzech za poslední dva roky evidované v CRM.

Implementace a automatizace procesu

Potom, co se podařilo sestavit a procesně automatizovat datovou matici zákazníků jednotlivých oddělení, stačilo už pouze implementovat sadu jednoduchých obchodních pravidel. Takovými pravidly jsou například podmínky typu: vyber pouze zákazníky konkrétního oddělení, pouze z ČR, se souhlasem pro kontakt, s účastí na dvou a více kurzech apod.

Obr. 2: Pravidla byla vizuálně formalizována pomocí výběrových uzlů v prostředí IBM SPSS Modeler.

Finále celého procesu pak spočívalo ve vytvoření sady excelovských souborů, které se importují do nástroje pro e-mailové kampaně. Později se ještě úloha rozrostla o kontrolu aktuálnosti e-mailových adres. Poté, co byly excelovské seznamy naimportovány do softwaru e-mailových kampaní a začaly být využívány, se postupně rozrůstal seznam neexistujících nebo jinak nefunkčních e-mailových adres. Tento seznam se pak ještě použil k očištění nově exportovaných excelovských výstupů. Je nutno zdůraznit, že export dat není jednorázová operace, ale pravidelně se opakující proces pracující s aktualizovanými údaji. Díky sofistikovanější identifikaci zákazníka pomocí jeho CRM ID se nyní neztrácí historie zákazníka o jeho účasti na kurzech Centra výuky v případě změny zaměstnavatele, či změny e-mailové adresy.

Ještě o krok chytřejší

Požadavek na tvorbu excelovských seznamů zákazníků s pravidelně aktualizovanými informacemi měl ještě jeden vedlejší pozitivní efekt. Všechny informace, které se o zákazníkovi nyní exportují, musí být úplné a aktuální. Zdá se to jako samozřejmost, ale do této doby tomu tak nebylo. Například obchodníci nevyplňovali oslovení. CRM sice nabízelo možnost ho zaznamenat, ale protože se nijak dále nevyužívalo, nikdo ho nevyplňoval. Nyní každý první týden v měsíci kolegyně ze systému e-mailových kampaní vyexportuje všechny neexistující či nefunkční adresy, já připravím seznam neúplných údajů v CRM a různých statistik, aby vybrané osoby mohly data doplnit, případně zkontrolovat, že jsou úplná. Následně se vyexportují aktualizované seznamy pro další e-mail kampaně, které si kolegyně převezme do svého systému a dál s nimi obchodně pracuje.

Seznamy obsahují všechny kurzy a kategorie kurzů, kterých se daný zákazník zúčastnil, včetně data realizace. Díky tomu je možno e-mailové kampaně cílit mnohem přesněji a personifikovaně. Můžeme oslovit účastníky konkrétních kurzů s nabídkou navazujícího vzdělávání, nebo zákazníky s určitou skladbou produktů. A to vše díky jednoduchému seznamu lidí, e-mailových adres a několika proměnným obsahujícím klíčové informace. Data mining nemusí nutně objevit něco nového, nýbrž poukazuje na to, co už je o zákazníkovi známo. Něco, co nebylo v návalu „datové hlušiny“ původně vidět nebo co bylo v datech uloženo nesourodě a nesystematicky. Data mining často dokáže najít význam, vzory a vazby tam, kde bychom je třeba ani nehledali.

Ing. Libor Šlik
Autor článku je vedoucím analytického oddělení ACREA, lektor, analytik a odborný konzultant. Svou profesní kariéru začal rozvíjet ve společnosti ACREA CR nejprve jako konzultant, správce serverových řešení a manažer technické podpory. Nyní jako vedoucí analytického oddělení se specializuje na řešení významných projektů pro velké společnosti v oblasti data miningu, sběru dat a jeho automatizace.