Jeste li ikada pokušali spojiti dvije krajnosti?

To je u principu nemoguće, ali u posebnim prilikama, posebnim mjestima ili s posebnim ljudima to je ipak nekako moguće. Na Zemljinim polovima se nekako spajaju noć i dan. Gordon Ramsey spaja slatko i slano. Hrvatska politika spaja to da se porezi i davanja podižu, pa bi to nekako trebalo podići i standard i potrošnju i blagostanje.

Okušali smo se i mi u takvim stvarima, te smo spojili nešto umno / tehnološko i nešto o čemu se ne raspravlja, a to je glazba. Za one koji nisu znali, Kristijan je izradio algoritam strojnog učenja koji kao osnovu uzima pjesme Cece, i pokušava napisati nove stihove u njenom stilu.

Članak smo popratili s kvizom koji se sastojao od 5 stvarnih stihova i 5 stihova koje smo mi kreirali. Odaziv publike bio je konkretan, od onih koji su samo riješili kviz da bi prijateljima pokazali da su upravo oni najveći poznavatelji Cecinog opusa, do onih koje je stvarno zanimala tehnologija iza svega toga.
Čak ni mi, kratko nakon što smo kviz napravili, nismo dobili 10/10 tako da čestitamo fanovima koji su to riješili bez problema. Mi nismo veliki fanovi.

Koncipirali smo oglašavanje u 4 grupe.

1) Fanovi Cece u HR.
2) Oni koje zanima umjetna inteligencija i strojno učenje u HR.
3) Fanovi Cece u okolnim državama (Slovenija, Srbija i BiH).
4) Oni koje zanima umjetna inteligencija i strojno učenje u okolnim državama (Slovenija, Srbija i BiH).

Koliko su te grupe međusobno isključivo možemo jako jednostavno i prikazati.

Hrvatska (realni rezultati): 

Slovenija, Srbija i BiH (realni rezultati):

Prije nego me proglasite hejterom ili se uvrijedite, pogledajmo što o tome kaže Facebook (ove brojke su procjena Facebooka).

Hrvatska (Facebook procjena):

Slovenija, Srbija i BiH (Facebook procjena):

Ok očito je da su publike jako podijeljene, i u principu zanima ih naš članak iz različitih razloga.

Tako da ćemo ih i drugačije razmatrati.

Analytics Podaci

Da vidimo kako je sve izgledalo u Analyticsu, gdje možemo popratiti rezultate svakog dijela kampanje, jer je svaki praćen s posebnim parametrima URL-u.

Sada je vrijeme za procjene, što mislite tko će više vremena provesti na stranici?

Oni zainteresirani za tehnologiju, ili oni koje zanima kako sami mogu napisati pjesmu kao Ceca.

Prvo što moramo pogledati da utvrdimo koliko smo uspjeli angažirati koju od grupa je broj koliko je puta određena grupa pogledala stranicu:

HR za Hrvatsku, Bal (kao Balkan) za Sloveniju, Srbiju i BiH

Cool brojevi. Nice!

Da budem iskren, sve vezano za ovaj članak je bio jedan veliki clickbait, i oglas je izgledao ovako:

Računali smo na dvije stvari s takvim oglasom.

Prva je da ćemo izazvati prave fanove da isprobaju (što je uspjelo nevjerovatno dobro), i ostave poplavu komentara kojima su u principu potvrdili koliko je algoritam dobar.

Druga stvar na koju smo računali je da će oni kojima će to biti zanimljivo s tehnološke strane vidjeti kroz clickbait, i doći radi tehnologije.

E da, trebao sam vam napomenti da je kampanja na okolne države krenula ipak nešto kasnije, prvo smo htjeli vidjelti da li će biti zanimljivo na “domaćem terenu”

Tako da ćemo i te dvije skupine razmatrati odvojeno.

Bez da otkrivam previše (jer nije relevantno), napomenuti ću da je dnevni trošak za svaku grupu otprilike isti, tako da to nije utjecalo na broj posjeta.

Onih koji su zainteresirani za strojno učenje očekivano je manje jer je oglas takav kakav je i možda je zahtjevalo malo više razmišljanja o “zašto se meni prikazuje ovaj oglas?”

A koliko su se zadržali?

Također napomena, u ovom članku se neću baviti toliko rezultatima na Facebooku i Instagramu, to je tema koja će doći na red u svoje vrijeme. I analiziramo samo one koji su došli preko kampanja, ne preko shareova, poruka i slično. To su već dvije teme za budućnost.

(psssst, na dnu članka je najava za nešto ultrazabavno u budućnosti)

Danas se isključivo bavimo onime što se događalo na našoj stranici, odnosno blog postu.

Ovdje već vidimo da se priča izokrenula. Vidimo da su se na samom članku više zadržavali oni koji spadaju u grupe zainteresirane za umjetne inteligenciju. Oni su proveli više vremena s nama jer su ušli dublje u pojedinosti tehnologije. Dok su “obožavatelji” riješili kviz, možda malo prozujali po članku, i tu završili naše druženje.

Matija, drobiš i puno pišeš, koja je poanta svega ovoga?

Poanta je da su rezultati podložni interpretaciji, i da morate biti pažljivi pri definiciji ciljeva.

Reach od 200 000 ljudi zvuči super, ali i na počeku smo bili svjesni da to neće polučiti poslovni rezultat, osim onoga da ni pravi fanovi ne mogu razaznati koje stihove smo mi proizveli, a koji su pravi.

Interpretacija rezultata i kontekst

Tako i dolazimo do prve najčešće greške pri interpretaciji nečega, a to je sam cilj i svrha nečega. Da su cilj upiti ova kampanja bi bila potpuno neisplativa (ali naše je ispunila).

Često se u analizama podataka desi da je pitanje krivo postavljeno, te je onda odgovor ili banalan ili ne odražava istinu u potpunosti. 

Iako rjeđe, također se radi o namjernom “savijanju “istine. “Razlikujemo laži, prljave laži i statistiku.”

Također, ako surađujete s nekime tko samo površno ulazi u srž stvari, moguće je “slučajno donijeti potpuno krive zaključke.”

Što možemo zaključiti iz sljedećeg grafa?

Bez konteksta zaključak koji ćemo izvesti je da rijetko koji fan Cece je zainteresiran za umjetnu inteligenciju i strojno učenje. I podaci to potkrepljuju crno na bijelo (odnosno crveno na zeleno).

Kako se ovako nešto dogodi?

Fali vam kontekst.

To su realni podaci Facebooka, što znači da je skup ljudi ograničen i nije uvijek reprezentativan.

Također, korisnici koriste Facebook za različite namjene, tako da netko tko ga koristi više u slobodno vrijeme imat će više interakcija s omiljenim glazbenim izvođačima, a netko tko ga koristi u poslovne svrhe imat će više interakcija s novim tehnologijama. Podaci bez konteksta su beskorisni.

Treće je to da su ovi podaci (koliko god jesu točni) nacrtani tako da opisuju situaciju, ali tu imamo dva ad seta koja su gađala dvije odvojene grupe ljudi, i u presjek spada samo ona mala grupa koja je vidjela oglas i zbog svog interesa u umjetnoj inteligenciji i svog interesa za Cecu.

Šum i greške u podacima

Još jedna stvar koje se moramo dotaknuti, kada smo već online i analiziramo Facebook kampanju, a to je šum u podacima. Za neku veću kampanju, podaci iz Facebook Ads sučelja jako rijeko će odgovarati onima iz recimo Google Analyticsa. I naravno svi tvrde da su njihovi točni a ostali griješe.

Nemojte se time previše zamarati, ali nemojte niti biti blesavi i uspoređivati podatke iz dva različita izvora. Podatke iz sučelja X uspoređujte samo s podacima iz sučelja X. Isto tako i za sučelje Y.

Zadnja stvar za danas, pozabavit ćemo se šumom (odnosno greškama) u podacima. (evo super, opet će Matija o fbclidu pričati -.-‘)

Već sam se nekoliko puta dotaknuo te teme – primarno ovdje.

Danas nećemo o uzrocima ili teorijama zavjere, danas ćemo malo detaljnije o obradi i odlukama vezanima sa “čudim” URL-ovima.

Fbclid dodan je na neke URL-ove, i uvijek se nameće pitanje što napraviti s time. Mislim da je moj stav nepotrebno kompliciran, ali najbolje odražava stvarno stanje.

Npr, za današnju analizu, ovo smo napravili s podacima:

Početni dataframe sastavljen je od svih linkova koji sadrže slug članka.

all_data_blog =  all_data[all_data[‘pg’].str.contains(“novi-tekstovi-cece-pomocu-umjetne-inteligencije”)]

To uključuje i:

…/novi-tekstovi-cece-pomocu-umjetne-inteligencije/

…/novi-tekstovi-cece-pomocu-umjetne-inteligencije

(slash je razlika, iako je landing isti u svim kampanjama)

…/novi-tekstovi-cece-pomocu-umjetne-inteligencije/?fbclid=XXXXXXXXX

I onda ih dodatno segmentirati:

all_data_blog_fbclid = all_data_blog[(all_data_blog[‘pg’].str.contains(“fbclid”) == True)]

all_data_blog_clean = all_data_blog[(all_data_blog[‘pg’].str.contains(“fbclid”) == False)]

Znam da će netko prigovoriti na moje pisanje koda, ali ako netko ima prigovore, slobodno mi se javite da vam pošaljem cijeli notebook, radio sam ga sam za sebe tako da će vam se dići kosa na glavi!

Kako sam već objasnio, podatke volim ostaviti u što originalnijem obliku, odnosno ne utjecati na prikupljanje podataka (što komplicira život kasnije ali točnost i istinitost su ultimativni ciljevi).

Onda odgovor na pitanje koliko je ukupno vremena određena skupina provela na članku (pomalo beskorisna metrika jer nismo televizija (iako exact-byte TV zvuči super)) glasi: 

Ukupni podaci kažu:

Ali ti ukupni podaci sastoje se od dva podskupa…

“čisti” URL-ovi

URL-ovi s fbclid

Da, komplicirano je, ali je istinito.

Zaključak

Ovo je trebao biti jedan jednostavan članak s vizualizacijom rezultata oglašavanja. Ali inspiracija je napravila svoje i sada već imam ideje za buduća dva članka i to su:

“Vizualizacija podataka iz Facebook Ads sučelja”

“Vizualizacija publika i presjeka publika na društvenim mrežama”

Nekada davno držao sam predavanje pod nazivom “Istine i laži u digitalnom marketingu” pa najavljujem i sljedeću veću temu

“2% Istine i 98% Laži u statistici” u kojima ćemo se pozabaviti najvećim uspjesima statistike i rudarenja podataka i najvećim glupostima koje su ljudi napravili s njima.