sbíraná databáze, kterou jsme měli vyhodnotit
které obsahoval vstupní datový soubor
díky kterému má klient přehled o ziskovosti středisek i produktů
Už na začátku podnikání jste chtěli řídit svůj business s pomocí dat. Pustili jste se tedy do jejich sběru. A dělali jste to 10 let. Hromadění informací je však jen začátek. V momentě, kdy chcete data vyhodnotit, se můžete zaseknout. Zpracování tak enormní databáze byste sice zvládli, ale už teď se hrozíte času, který vám to zabere. Přesně v takové situaci byl i náš klient Tatry Mountain Resorts (TMR), který nás oslovil s jasným požadavkem: na základě analýzy dat o zákaznících nalézt odpovědi na otázky klíčové pro jeho business.
Společnost Tatry Mountain Resorts se za dobu deseti let své existence stala největším investorem v regionu Vysokých a Nízkých Tater. Spravuje 20 hotelů, 10 lyžařských středisek, přes 40 barů a diskoték a také aquaparky, restaurace, lyžařské školy, sportovní obchody a mnoho dalšího na Slovensku, v České republice a Polsku.
Klient chtěl vytěžit databázi a díky ní nejen lépe poznat zákazníky, ale také zjistit, která střediska přinášejí největší zisky.
Potřeboval zjistit, které produkty jsou nejziskovější, jak si v prodeji vede chytrá permanentka, nebo jaké je demografické rozložení zákazníků v jednotlivých střediscích.
V rámci dataminingu jsme proto navrhli zpracování a úpravu dat pro segmentační otázky, které jsme zákazníkovi pomohli sestavit. Poté už přišel čas na čištění a analýzu dat.
Už z úvodu musí být jasné, že 10 let sbíraná databáze se úplně na disketu nevejde. Nemohli jsme proto použít tradiční metody zpracování. Místo toho jsme „povolali do zbraně“ nástroj přímo určený na zprocesování tak velkého objemu dat – Apache Spark.
Největší výzvou bylo správné uchopení dat a pochopení závislostí, které nebyly na první pohled jasné. Následně jsme všechny analýzy několikrát zopakovali, protože při čištění a analýze dat bylo často možné přijít na spolehlivější nebo přesnější metodu. Tento proces proto vyžadoval rozumné nastavení dotazů, testování metod na menších souborech dat s následným nasazením na reálná data.
A co bylo výsledkem našeho snažení? Vypočítali jsme potřebné metriky i tabulky a grafy jsme vizualizovali do prezentace v našem Mark O. Jak to vypadalo?
Počet nákupů obecně od roku 2019 klesá v důsledku pandemických opatření. Naopak míra opakovaných nákupů se drží na stabilní úrovni kolem 70 % (v naší analýze pracujeme s filtrovanými offline nákupy).
Téměř polovina (49.3 %) nakupuje pro 2 nebo 3 osoby. 22.7 % nakupuje jen pro jednu osobu, to ale neznamená, že nejedou na hory v partě,
A co by mohlo následovat? Automatizace definovaných segmentů a jejich sledování v reálném čase – třeba při nasazení různých strategií, které je mohou ovlivnit. Ať už se naše společné kroky s TMR budou ubírat kamkoliv, už teď se na ně těšíme!