Dáta sú neodmysliteľnou súčasťou online marketingu. K tomu patrí ich zbieranie, čistenie, spájanie, analyzovanie a vizualizovanie. Tieto činnosti môžu prebiehať v CRM systémoch, reklamných systémoch, externých nástrojoch alebo vo väčšine jednoduchších analýz aj v Google Sheets. Ak patríte k takmer miliarde (900 000 000) aktívnych používateľov Google Sheets, tabuľky pravdepodobne (aspoň občas) využívate aj na analýzu dát. Ak narážate na limity a Google tabuľky vám už nestačia, máme pre vás alternatívu – Google BigQuery.
- Čo je BigQuery?
Z oficiálnych zdrojov sa dočítame, že BigQuery je Cloudové dátové úložisko na podporu inovácií založených na údajoch. Alebo že BigQuery je bezserverové a nákladovo efektívne biznisové dátové úložisko, ktoré funguje v cloudoch a škáluje sa spolu s vašimi dátami.
Zjednodušene povedané, BigQuery predstavuje (cenovo aj technicky) dostupné úložisko vašich dát vo forme databáz (tabuliek).
- Ako BigQuery vyzerá?
Rozhranie BigQuery je plné tabuliek, ktoré sú zoradené do projektov a datasetov pre lepšiu prehľadnosť. Podobne ako v prípade Google Sheets, tabuľky môžu mať rôznu veľkosť, počet riadkov, stĺpcov a obsahovať rôzne typy dát.
- Aké sú výhody BigQuery?
Poďme si predstaviť výhody BigQuery, pričom sa zameriame najmä na porovnanie s Google Sheets.
- Neobmedzená kapacita
Prvou veľkou výhodou je v podstate neobmedzená kapacita. Aktuálne najväčšia tabuľka, ktorú v BigQuery používame má približne 250 000 000 riadkov a 48 stĺpcov. Pre porovnanie, maximálny počet buniek v Google Sheets je len 10 000 000, to je 1200x menej ako spomínaná tabuľka, čiže sa ani zďaleka nepribližuje k limitom BigQuery.
-
Obrovská rýchlosť
Druhou veľkou výhodou je rýchlosť spracovania a manipulácie s dátami. Aj napriek limitu 10 000 000 buniek je veľmi pravdepodobné, že s rýchlostnými limitmi Google Sheets sa stretnete oveľa skôr ( záleží od objemu dát, počtu vzorcov a podobne). Google Sheets sa zvyknú spomaľovať a zasekávať, čo pri BigQuery v podstate nehrozí. Spracovanie (tzv. dopytovanie) dát je plynulé a trvá spravidla zopár sekúnd, pri väčších objemoch to sú desiatky sekúnd.
- Integrácie
Na BigQuery je možné napojiť viacero externých nástrojov, vďaka čomu sa stáva ešte dostupnejším riešením pre spracovanie dát. Nielen Google služby ako Google Analytics, Google Ads či Google Merchant Center je možné za pár klikov prepojiť s BigQuery. Integrácie s BigQuery majú aj ďalšie nástroje na prácu s dátami ako napríklad Make, Keboola či Supermetrics.
Spomenuli sme 3 základné výhody pre používateľov, ktorí napríklad potrebujú výkonnejšiu alternatívu Google Sheets. Výhod BigQuery pre pokročilých používateľov je ešte omnoho viac, ako napríklad škálovanie, využitie AI, ukladanie dát v rámci EÚ, využívanie pokročilých operácií s dátami a ďalšie. O nich si napíšeme niekedy nabudúce.
4. Aké sú nevýhody BigQuery?
Všetko má svoje pozitívne aj negatívne stránky. Práca s BigQuery nie je výnimkou a najmä pre menej skúsených užívateľov môže byť na úvod komplikovaná. Poďme na hlavné nevýhody práce s BigQuery.
- Nutná znalosť rozhrania
Prvou prekážkou používania BigQuery môže byť potrebná znalosť rozhrania tohto nástroja. Aj napriek tomu, že rozhranie BigQuery nepatrí k tým najzložitejším, v porovnaní s rozhraním Google Sheets je to predsa len o niečo komplikovanejšie. Zorientovanie sa v rozhraní a využitie základných funkcií môže byť otázka niekoľkých dní či týždňov, záleží od intenzity učenia a skúšania samotného rozhrania.
- Nutná znalosť SQL
Druhou prekážkou používania môže byť nutná znalosť SQL (Structured Query Language). SQL je databázový (dopytovací) jazyk, ktorý slúži na manipuláciu s databázami a dátami v nich. Práca s dátami v BigQuery je iná ako práca s dátami v Google Sheets. Nie je možné dáta jednoducho kopírovať, pridávať, meniť obsah bunky, pridávať vzorce a podobne. Na manipuláciu s dátami je nutné využívať práve príkazy v SQL, ktoré môžu dáta z tabuliek vyťahovať, upravovať, pridávať, kombinovať a rôzne inak spracovávať.
Príkazy v SQL môžu byť jednoduchšie
SELECT * FROM `acbigquery.analytics_271446565.events_20240410` LIMIT 1000
alebo zložitejšie (tento príkaz bol navyše zámerne skrátený o približne 80 % kvôli prehľadnosti)
CREATE TEMP FUNCTION accent2latin(word STRING) AS
((
…
));
SELECT
accent2latin(strings),
SUM(search_volume) AS SEARCH_VOLUME,
…
FROM
`keyword-tool-376209.test.keywords_for_keywords_test`,
UNNEST(SPLIT(keyword, ” “)) AS strings
GROUP BY strings
ORDER BY SEARCH_VOLUME DESC
- Cena
BigQuery je na rozdiel od Google Sheets platený nástroj, čo môže viacero potenciálnych používateľov na prvý pohľad odradiť. Výhodou však je, že cenový model je založený na reálnom využití funkcií BigQuery. Jeho cena záleží od množstva dát, ktoré sú v BigQuery uložené a prenášané (dopytované cez SQL príkazy).
Cena za 1 GiB uložených dát je 0,02 $ (v prípade tabuliek, ktoré neboli upravené viac ako 90 dní – tzv. long-term storage, je cena 0,01 $ / GiB)
Cena za 1 TiB (1024 GiB) prenesených dát je 6,25 $
Navyše každý používateľ má k dispozícii každý mesiac zadarmo 1 TiB prenesených dát a 10 GiB uložených dát.
Pozn.: TiB, resp. GiB vyjadrujú jednotky kapacity pamäťových médii tebibajt / gibibajt (často zamieňané aj s bežne používanými jednotkami terabajt, resp. gigabajt – TB / GB). Rozdiel je v používaní systému na prepočet. Kým GB / TB a ďalšie jednotky používajú na prepočet decimálnu sústavu (10^3), GiB / TiB a ďalšie jednotky používajú binárnu sústavu (2^10). Z toho dôvodu 1 TB = 1000 GB, ale 1 TiB = 1024 GiB. 1 TiB, resp. 1 GiB = približne 1,1 TB, resp. 1,07 GB.
V závislosti na objeme spracovávaných dát v BigQuery môže cena dosiahnuť ani nie jednotky eur. Pre predstavu, cena BigQuery pre priemerného klienta s návštevnosťou webu v rádoch stoviek denne, ktorý využíva napojenie Google Analytics dát, Google Ads dát a niekoľkých menších doplnkových tabuliek je 0,15 – 2,90 € mesačne. Podrobný cenník BigQuery nájdete tu – https://cloud.google.com/bigquery#pricing
- Tabuľkové schémy
Výhodou aj nevýhodou zároveň je striktné dodržiavanie tabuľkových schém v rámci BigQuery. Každá tabuľka má svoju schému, ktorú musia dáta v nej spĺňať. Napríklad, ak je v schéme definovaný druhý stĺpec ako číslo, dáta v druhom stĺpci musia byť výhradne čísla a nie je možné do tohto stĺpca nahrať textový obsah. Výhodou však je, že vďaka tejto podmienke sú dáta spravidla konzistentnejšie a spoľahlivejšie na ďalšiu prácu.
5. Limity bezplatnej verzie?
Napriek tomu, že je BigQuery platený nástroj, ponúka aj bezplatnú verziu, tzv. Sandbox. Tá je síce úplne bezplatná, dokonca nie je potrebné zadanie fakturačných údajov a platobnej karty, ale vďaka obmedzeniam je na dlhodobé využitie v podstate nepoužiteľná. Vhodná je len na úvodné testovanie a zoznámenie sa s prostredím.
Medzi hlavné limitácie patrí predvolená expirácia tabuliek (90 dní) a nedostupnosť funckie Data Transfer, vďaka ktorej je možné automaticky (napr. na dennej báze) nahrávať do BigQuery dáta z Google Ads, Google Merchant Center či iných zdrojov.
6. Ako začať?
BigQuery je súčasťou Google Cloudu, stačí si teda vytvoriť projekt a začať používať BigQuery Sandbox, čiže bezplatnú verziu. Pre nových používateľov BigQuery určite odporúčam minimálne základný online kurz na prácu s BigQuery. Učenie sa v novom prostredí tak pôjde oveľa rýchlejšie. Nemusíte sa báť ani platených kurzov, ktoré sú zväčša prínosnejšie a aktuálnejšie. V prípade základov nebude cena vysoká a pomer cena a výkon, resp. prínos a hodnota budú stáť za to.
https://console.cloud.google.com/bigquery
Predstavili sme si základné rozdiely, výhody a nevýhody BigQuery v porovnaní s Google Sheets. Neznamená to, že by ste mali Google Sheets okamžite vymeniť za BigQuery. Na menšie analýzy a prácu s malým objemom dát budú vo väčšine prípadov Google Sheets pravdepodobne vhodnejšie, aj keď vytvorenie tabuľky, nahratie dát a ich základná úprava potrvá desiatky sekúnd až jednotky minút. Ak však pracujete s väčším objemom dát, ktoré potrebujete dlhodobo využívať a prípadne škálovať, BigQuery môže byť tým správnym riešením.