Marketing a najmä ten onlinový, je plný dát. Dáta využívame na analýzy, predikcie, cielenie, vyhodnocovanie, optimalizácie a v podstate na všetko. Dáta využívajú reklamné systémy na tvorbu publík či fungovanie algoritmov a smart biddingových stratégií. V tomto článku sa zameriame primárne na dáta v Google Analytics. Koľko dát v Google Analytics potrebujeme na to, aby sme mohli vyhodnocovať výsledky kampaní či robiť kvalitné biznisové rozhodnutia? 15 %? 30 %? 68 %? 80 %? 93 %? A čo to má spoločné s nedávnymi prezidentskými voľbami na Slovensku?
Keď som na úvod spomínal, že online marketing je plný dát, nie je to už tak celkom pravda. Tých dát (z hľadiska Google Analytics) je stále menej a dostať sa k relevantnej vzorke dát začína byť čím ďalej tým náročnejšie. Rôzne blokátory, anonymné prehliadače, do toho cookies lišty a pokojne sa môže stať, že bez akejkoľvek optimalizácie je zrazu web / e-shop na polovici dát o svojich návštevníkoch. Na úvod som sa zamyslel, koľko percent dát skutočne potrebujeme na kvalitné rozhodnutia nielen v marketingu ale aj v “bežnom” živote. Pravdepodobne už tušíte, že ani 15 ani 30 % stačiť nebude. A koľko teda?
V marci (1. kolo) a apríli (2. kolo) 2024 sa na Slovensku konali prezidentské voľby, v ktorých najväčšími favoritmi (a aj postupujúcimi do druhého kola boli Peter Pellergrini a Ivan Korčok). Nebojte sa, nebude to o politike, pozrieme sa na to len z pohľadu čísel (dát). Niektoré prieskumy jednoznačne favorizovali jedného, iné zas druhého, no a viaceré prieskumy naznačovali mimoriadne tesný výsledok. O tom, koľko dát skutočne potrebujeme som sa zamyslel pri sledovaní večerného (alebo skôr nočného) vysielania po druhom kole, kde na viacerých TV staniciach tradične chodia rôzne prieskumy, komentáre, analýzy, a po skončení moratória a nabehnutí prvých spočítaných hlasov aj prvé výsledky. Robil som si priebežne mini analýzy a prepočty, kde ma zaujímali primárne 2 otázky
– Koľko % zo zvyšných hlasov potrebuje získať kandidát, ktorý aktuálne prehráva, aby nakoniec vyhral?
– Má už aktuálny líder istotu výhry?
Len malá vsuvka / pripomenutie (alebo ukážka pre tých, ktorí majú lepšie veci na práci ako sledovať volebné štúdiá), ako to na obrazovkách TV približne vyzeralo.
K dispozícií boli tieto dáta
– % spočítaných hlasov
– % hlasov pre Petra Pellegriniho
– % hlasov pre Ivana Korčoka
Vidíme postupne rôzne percentá podľa podielu spočítaných hlasov, ale nevidíme absolútne čísla. Možno si poviete, že tu chýbajú a bez nich sa nedá robiť ďalšia analýza / výpočty. Nie je to ale celkom tak. Pravdou je, že tieto dáta nám bohate stačia, čo si o chvíľu na konkrétnych príkladoch ukážeme.
Tí, ktorí by si chceli robiť výpočty na absolútnych číslach a nie percentách, si pokojne môžu dosadiť ľubovoľné číslo za celkový počet hlasov, z ktorých sa výsledky počítajú. Môže to byť 1000, 10 000, 100 000 alebo aj 2 671 279 hlasov (čo je reálna volebná účasť v druhom kole).
Kým prejdeme k reálnym príkladom, pozrime sa na 2 konkrétne príklady pre ukážku toho, na čo sa budeme zameriavať. Predstavme si, že súťažia medzi sebou červený a modrý kandidát, kde hlasuje 1000 ľudí a každý môže hlasovať buď za červeného alebo modrého kandidáta. Na výhru je potrebná nadpolovičná väčšina (platných) hlasov, teda v tomto prípade na výhru treba min. 501 hlasov.
Predstavme si prvú situáciu, že je spočítaných 30 % hlasov a všetky hlasy získal červený kandidát. Má teda 300 hlasov a je blízko výhre. Má však modrý kandidát stále šancu? Áno, má. Zo zvyšných 700 hlasov potrebuje získať minimálne 501, čo je takmer 72 % zo zvyšných hlasov. Ťažké? Určite áno. Nereálne? Určite nie.
Poďme ale na druhú situáciu. Spočítaných je 50,1 % hlasov a všetky pripadli červenému kandidátovi. Má teda 501 hlasov a siaha po výhre. Má ešte modrý kandidát šancu? Áno, môže sa spoliehať na anuláciu niektorých hlasov alebo zneplatnenie volieb a opakované hlasovanie. V našom príklade však počítame len s číslami a v tom prípade šancu nemá. V “hre” je už len 499 hlasov a aj keby ich všetky získal modrý kandidát, šancu už nemá.
Týmto jednoduchým príkladom sme si ukázali 2 veci – ako sa budeme pozerať na nasledujúce reálne príklady z volieb a to, že v niektorých prípadoch nám môže stačiť aj necelých 51 % dát na vyvodenie záveru / výsledku celej množiny dát (aj keď uznávam, tento príklad bol extrém).
Vráťme sa ale k realite.
Ako som spomínal, k dispozícií v priebežných výsledkoch máme okrem iného tieto dáta, ktoré nám na náš účel stačia.
– % spočítaných hlasov
– % hlasov pre Petra Pellegriniho
– % hlasov pre Ivana Korčoka
Pre zjednodušenie budem kandidátov označovať ako PP (Peter Pellegrini) a IK (Ivan Korčok).
Prvé, ako tak relevantné výsledky boli pri spočítaní prvých 15 % hlasov
Pri tomto počte spočítaných hlasov mal PP na prvý pohľad solídny náskok. Ak však zoberieme do úvahy to, že nie je spočítaná ani ⅙ hlasov, IK stačí na výhru zisk 53 % zo zvyšných hlasov, ktoré spočítané nie sú. A to vôbec nie je zlá pozícia, je to len niečo málo cez polovicu zvyšných hlasov. Úvodný náskok je teda v % zisku pre jednotlivých kandidátov pri tomto počte spočítaných hlasov trochu “zavádzajúci”. Poďme ďalej.
Pri 30 % sčítaných hlasov dotiahol IK niekoľko percentuálnych bodov oproti predchádzajúcemu stavu. Spočítaných je však dvojnásobný počet hlasov a náskok PP je stále zjavný. Mohlo by sa zdať, že IK potrebuje na výhru už solídnu väčšinu zvyšných hlasov. Opäť môže zdanie klamať, na výhru mu stačí “len” 55 %, teda skoro rovnaké percento ako pri 15 % spočítanosti. Poďme ďalej.
Skočíme rovno na spočítanosť ľahko cez dve tretiny hlasov. Tu IK opäť stiahol náskok PP a vyzerá to tak, že by sa mu mohlo podariť získať väčšinu. Zo zvyšných hlasov potrebuje získať 66 %, čo je pomerne výrazný skok oproti predchádzajúcim stavom. Poďme ďalej.
Pri spočítanosti 80 % dokázal IK stiahnuť len 1 percentuálny bod. Pomer hlasov sa teda takmer nezmenil, ubudol však počet zostávajúcich, nespočítaných hlasov, z ktorých IK potrebuje získať už minimálne 77 %. Matematicky to síce bez problémov vychádza, politicky už niektoré televízie a denníky “predpovedajú” triumf PP. Poďme ďalej
Dostávame sa na 88 % spočítaných hlasov a IK opäť stiahol len 1 percentuálny bod. Zo zvyšných hlasov by tak potreboval získať 93 %. Matematicky je to stále bez problémov reálne, politicky už aj zvyšok televíznych staníc a denníkov ohlasuje, v podstate istú, výhru PP. Poďme ale ďalej.
Spočítanosť nám poskočila na 93 % a IK stiahol 2 percentuálne body. Mohlo by sa zdať, že podobným tempom by sa mu mohlo podariť zvíťaziť, aj keď len tesným pomerom 51:49. Avšak nie je to tak, zo zvyšných dostupných nespočítaných hlasov by potreboval získať 103 %. A to nie je možné nielen politicky ale už ani matematicky.
V tomto prípade je teda jasné, že sa prezidentom stane Peter Pellegrini. Aj keby všetky zvyšné hlasy pripadli jednému či druhému kandidátovi, na výsledku to nič nezmení. Zjednodušene a čisto matematicky by sa dalo povedať, že v tomto momente sú voľby rozhodnuté a zvyšné hlasy netreba ani počítať.
Aké je základné posolstvo z tohto príkladu? Je to hlavne to, že na rozhodnutia a závery, ktoré sú založené na dátach (čo je aj rozhodnutie o prezidentovi), nie vždy potrebujeme 100 % dát. Niekedy máme záverečnú informáciu oveľa skôr.
Zjednodušený príklad – vo firme máme 25 ľudí, ktorí idú na teambuilding a demokraticky hlasujú, či pôjdu do Tatier alebo na Balaton. Ak z prvých 15 hlasujúcich 13 povie, že chce ísť do Tatier, hlasy ostatných sú už bezpredmetné.
A teraz to najpodstatnejšie. Ako to súvisí s online marketingom a Google Analytics?
Aj v Google Analytics máme rôzne dáta a pravdou je, že nikto tie dáta nemá (a ani nebude mať) 100-percentné. Niekto má v GA 95 % dát, niekto 89 %, niekto 60 % a niekto možno len 30 %. Časť používateľov pravdepodobne ani netuší, koľko % dát v skutočnosti má alebo nemá.
A tu prišlo moje zamyslenie – koľko dát skutočne potrebujeme v GA na kvalitné rozhodnutia? Oplatí sa hnať za dokonalosťou a keď už nie 100, tak získať aspoň 98 alebo 99 % dát?
Oplatí sa investovať 10 hodín do analytiky, ktorá nám prinesie 90 % dát alebo radšej 30 hodín do analytiky, ktorá nám prinesie 95 % dát? Rozdiel 5 % a rozdiel 20 hodín. Odpoveď, ako to už býva v marketingu zvykom, je “Záleží”. Pre niektoré účty môže byť 5 % niekoľko tisícov či miliónov v tržbách, pre iné účty bude 5 % predstavovať zopár objednávok mesačne.
Môj názor je, že pre väčšinu (najmä malých a stredných účtov) nemá zmysel hnať sa za dokonalosťou a každým % nazbieraných dát.
Uveďme si jeden posledný príklad na záver, ktorý sa bude týkať už priamo Google Analytics a dát v ňom. Predstavme si, že sa pozeráme na dáta s tržbami v Google Analytics, pričom vieme, že naše náklady na reklamu boli 4000 €. Tržby v Google Analytics sú 12 000 €, čo predstavuje podiel 50 % na celkových tržbách (zvyšných 50 % tržieb majú iné kanály). To znamená, že PNO je zaokrúhlene 33 %. Je to dobré alebo zlé? Samozrejme, opäť záleží.
Ak je marža 80 %, potom to môže byť v poriadku a ak je marža 20 %, potom je to strata – logicky. Lenže, dôležitým údajom je aj to, koľko % dát v Google Analytics máme. Ak 100 %, potom je to jasné, záver si spravíme podľa marže a cieľa kampane. Ak nie, musíme sa zamyslieť, či aj v tých chýbajúcich dátach nie sú konverzie, ktoré doniesla spomínaná kampaň za 4000 €.
Ak by sme vedeli, že máme v GA napr. 50 % dát, potom môžu nastať 3 scenáre
– zo zvyšných “neviditeľných” tržieb nie je už nič, čo by pochádzalo z tejto kampane
– zo zvyšných tržieb pochádza všetko z tejto kampane
– zo zvyšných tržieb časť pochádza z tejto kampane (najpravdepodobnejší scenár)
Ak by sme sa držali prvého scenára, PNO by nám zostalo na úrovni 33 % (nezmenili sa ani tržby ani náklady). Ak by sme sa priklonili k druhému scenáru, zvyšných 24 000 € v tržbách (chýbajúca polovica dát) by pripadlo kampani, kde by sme sa pri nákladoch 4000 € a “nových” tržbách 36 000 € dostali na PNO ľahko cez 11 %. Pri poslednom scenári záleží na tom, aké % z chýbajúcich dát by sme pripísali tejto kampani. Ak by sme išli štýlom, že pripíšeme rovnaké % z chýbajúcich dát ako to, ktoré tvorí podiel v aktuálnych dátach, počítali by sme s tým, že z chýbajúcich dát “patrí” polovica tejto kampani. Dostali by sme teda na čísla 4000 € náklady a 24 000 € výnosy, čím sa dostávame na PNO takmer 17 %.
Nech by sme teda zobrali akýkoľvek optimistický, či pesimistický scenár, z pôvodných 33 % by sme sa dostali niekde do rozmedzia 11 – 33 %. To znamená 200 % maximálnu odchýlku (pri porovnaní minimálnej a maximálnej hodnoty), čo je skutočne veľmi veľa.
Pre zjednodušenie a prehľadnosť som dal dáta pri rôznom počte dostupných dát do tabuľky. Max. % odchýlka tu predstavuje relatívny rozdiel medzi najnižšou a najvyššou hodnotou PNO. Parametre nášho prípadu sú rovnaké ako na príklade vyššie.
Podiel dát v GA | Minimálne PNO | Maximálne PNO | Max. % odchýlka |
15 % | 2,7 | 33 | 1122 % |
30 % | 2,9 | 16,7 | 478 % |
68 % | 3,8 | 7,4 | 95 % |
80 % | 4,2 | 6,3 | 50 % |
93 % | 4,7 | 5,4 | 15 % |
Vidíme, že pri vyššom podiele dát v GA4 max. % odchýlka exponenciálne klesá. Pri 93 % dát je maximálna odchýlka už len 15 %, pričom sa stále bavíme o tom najväčšom extréme.
Keď sa pozrieme na hodnotu PNO, väčšine malých a stredných biznisov bude pravdepodobne jedno, či majú PNO 4,7 alebo 5,4 %. Niektorým by problém nerobil ani rozdiel pri 80 % podiele dát alebo dokonca 68 %. Samozrejme podiel dát na úrovni 50 % a menej už považujem za celkom vážny problém a extrém.
Zostaňme ale pri 93 % podiele dát. Ten sa z nášho príkladu zdá byť dostatočným na určovanie výsledkov kampane alebo návrh hypotéz či dôležitých rozhodnutí. Môj odhad je, že pre väčšinu biznisov bude dostatočných 90 % a viac dát. Či už to bude rovných 90 %, 97 % alebo 93 %, na tom už tak veľmi nezáleží. Samozrejme platí, že čím viac dát, tým lepšie, dôležité je však aj to, za akú cenu. A nie je to len o peniazoch ale aj čase a energií. Pre malé a stredné firmy môže byť dostatočných aj 80 % dát.
Aj keď výsledky kampaní a dáta v Google Analytics nie sú presne ako výsledky prezidentských volieb, kde sú len 2 možné závery, isté paralely sa tu nájsť dajú.
Čo si z toho zobrať?
Cieľom bolo v prvom rade poukázať na to, že nepotrebujeme v Google Analytics 100 % dát na to, aby sme mohli s týmto nástrojom pracovať a robiť na základe neho rozhodnutia / závery.
Taktiež som chcel poukázať na drobnú paralelu medzi analytikou a politikou – aj napriek tomu, že sa v mnohom líšia, mnohé majú spoločné.
Mojim pôvodným zámerom bolo pripraviť nie priveľmi odborný článok plný anglických výrazov, s ktorými sa aj ja stretávam a študujem pravidelne, ale skôr alternatívny článok, ktorý dá na chvíľu vydýchnuť od všetkých tých dát, prehľadov a nástrojov, z ktorými sa denne v analytickom a online marketingovom svete stretávame. Musím priznať, že minimálne v rovine čísel sa mi to (pozerajúc na početnosť všetkých tých percent a ďalších údajov) priveľmi nepodarilo.
Každopádne aby nezostalo len pri teórii, v budúcnosti sa pozrieme na to, ako získať aspoň taký objem dát, na základe ktorého môžeme robiť kvalitné marketingové a biznisové rozhodnutia.
—
Niekoľko poznámok “pod čiarou”, ktoré ste si možno pri čítaní článku všimli / uvedomili.
Vybraný príklad s voľbami neplatí vždy. Na Slovensku dokonale funguje vďaka väčšinovému systému a jednému volebnému obvodu (tým sa napr. líši od prezidentských volieb v USA).
Tento článok nebol klasický odborný článok, akých aj ja o Google Analytics čítavam mraky. Bol skôr filozofický a zámerne obsahoval zjednodušenia a zaokrúhlenia. Určený je aj pre širšiu skupinu fanúšikov online marketingu, ktorý s Google Analytics tak často nepracujú (alebo nepracujú vôbec) a táto téma ich zaujíma. Verím, že som týmto numerickým hurikánom nikoho z nich neodradil.