Seznam.cz zpřesňuje reklamní cílení, využívá nové technologie
Během posledního roku Seznam.cz zcela přepracoval metodu, jak identifikuje zájmy uživatelů, popisuje Jiří Udatný.
![Jiří Udatný, ředitel divize Identity a uživatelského profilu Seznam.cz, zdroj: Seznam.cz](https://mediagurucdneu.azureedge.net/media/zmoh4p4o/jiri-udatny_fot-seznam.jpg)
Jiří Udatný, ředitel divize Identity a uživatelského profilu Seznam.cz, zdroj: Seznam.cz
V digitální reklamě je přesné a relevantní oslovení cílového publika klíčové. Seznam již řadu let investuje do inovací, které umožňují detailně segmentovat uživatele a tím zvyšovat návratnost investic (ROI) i celkovou účinnost kampaní. V tomto článku představí Jiří Udatný, ředitel divize Identity a uživatelského profilu Seznam.cz, dvě hlavní oblasti, na kterých Seznam.cz kontinuálně pracuje – socio-demografické cílení a zájmové cílení. Vše je postaveno na rozsáhlém datovém profilu uživatele a moderních technologiích, jako je strojové učení, velké jazykové modely či hluboké neuronové sítě.
Soc-dem: Vysoká přesnost díky přihlášeným uživatelům
Představte si, že propagujete novou řadu kosmetických produktů. Díky cílení na základě věku a pohlaví se vaše reklama zobrazí například ženám ve věku 40–59 let, což výrazně zvyšuje pravděpodobnost zásahu správného publika. Na jakém základě je soc-dem cílení postaveno?
Seznam.cz rozlišuje mezi dvěma skupinami uživatelů:
- Přihlášení uživatelé: Využíváme informace, které uživatelé zadali při registraci do Seznam účtu. Přihlášení uživatelé tvoří zhruba ¾ celého provozu. Díky tomu získáváme vysoce přesné údaje, a proto očekáváme, že s dalším růstem podílu přihlášených uživatelů bude kvalita cílení nadále růst.
- Nepřihlášení uživatelé: Zde nasazujeme pokročilé modely strojového učení, které analyzují chování na internetu – od navštívených stránek až po dobu návštěvy. Tím dokážeme odhadnout věk a pohlaví uživatele s vysokou mírou přesnosti.
Technologie za tím vším
K určování věku a pohlaví nepřihlášených uživatelů využíváme modely strojového učení. Strojové učení je oblast umělé inteligence, která umožňuje počítačům „učit se“ z dat bez explicitního programování. V našem případě se modely učí rozpoznávat vzorce v chování uživatelů, které souvisejí s jejich věkem a pohlavím.
V roce 2024 jsme nasadili zcela nové modely pro klasifikaci pohlaví a věku, které nahradily již zastaralé původní klasifikátory. Tím jsme významně zvýšili přesnost klasifikace nepřihlášených uživatelů i přesnost tohoto cílení jako celku.
Nové modely také pravidelně přetrénováváme, abychom v každém momentu reflektovali změny v prostředí, chování uživatelů či sezónnost.
Měření přesnosti a ověřování výsledků
Hlavním ukazatelem úspěšnosti socio-demografického cílení je metrika „on-target impressions share“, tedy podíl impresí doručených do požadované cílové skupiny. Externí měření od renomovaných výzkumných agentur opakovaně potvrzují vysokou přesnost – u některých skupin dokonce až přes 90 %.
![Zdroj: Seznam.cz, Nielsen. Pozn.: Data Nielsen z roku 2018 jsou poslední dostupná](https://mediagurucdneu.azureedge.net/media/ojqpinyt/seznam_graf.jpg)
Zdroj: Seznam.cz, Nielsen. Pozn.: Data Nielsen z roku 2018 jsou poslední dostupná
Nové zájmové cílení v Skliku: Přesnější identifikace uživatelských zájmů
Jak vzniká profil zájmů?
Druhým inovovaným typem cílení je zájmové cílení. Zde se vytváří profil uživatele na základě jeho internetového chování – sledování webů, vyhledávaných dotazů či prohlíženého obsahu. Po udělení souhlasu s cílenou reklamou se profil neustále aktualizuje, aby reflektoval aktuální zájmy uživatele.
Jak zájmy vznikají?
Analyzujeme pohyb uživatelů na našich stránkách i na webech našich partnerů. Pokud uživatel udělí souhlas s cílenou reklamou, vytvoříme pro něj profil zájmů podle toho, jaké stránky navštěvuje a jaké produkty vyhledává.
Pro tento proces využíváme pokročilé technologie strojového učení:
- Klasifikátor navštívených stránek: Analyzuje obsah webových stránek, které uživatel navštívil.
- Klasifikátor vyhledávacích dotazů: Přispívá k určení zájmů na základě vyhledávaných výrazů.
Zájmy aktualizujeme v reálném čase, takže se profil neustále přizpůsobuje aktuální aktivitě uživatele. Díky tomu se může uživateli zobrazit relevantní reklama již při první návštěvě stránky na dané téma. Starší návštěvy mají menší váhu, což zajišťuje, že profil reflektuje spíše aktuální zájmy.
![Zdroj: Seznam.cz](https://mediagurucdneu.azureedge.net/media/sypdabdn/seznam_graf2.jpg)
Zdroj: Seznam.cz
Co je nového?
Během posledního roku jsme zcela přepracovali metodu, jak zájmy uživatelů identifikujeme. Díky využití moderních technologií – hlubokých neuronových sítí, pokročilých jazykových modelů (včetně našeho vlastního SeLLMa) a nejnovějších technik přirozeného zpracování jazyka (NLP) – jsme dosáhli výrazného zpřesnění klasifikace obsahu.
![Zdroj: Seznam.cz](https://mediagurucdneu.azureedge.net/media/mwnpqqnj/seznam_graf-3.jpg)
Zdroj: Seznam.cz
Dříve jsme používali techniky, které převáděly texty z navštívených webových stránek do základní podoby (tzv. lemmatizace), aby bylo možné je jednoduše analyzovat. Na základě výskytu typických klíčových slov jsme pak texty řadili do příslušných zájmových kategorií. Tato metoda však nedokázala plně zachytit celkový kontext obsahu.
Nyní generujeme stovky vzorových článků pro každou zájmovou kategorii a využíváme pokročilé metody pro porovnání aktuálního obsahu s předdefinovanými vzory (tzv. vektorizace). Tento přístup nám umožňuje přiřadit uživatele do zájmových kategorií s výrazně vyšší přesností. Navíc jsme již začali trénovat náš model podle tzv. IAB taxonomie, což nám v budoucnu umožní snadno přejít na celoevropský standard identifikace zájmů.
Příklad původní klasifikace obsahu (těhotenství) vs. nová klasifikace (zdraví). Nové modely dokážou mnohem přesněji identifikovat kontext obsahu a tím článek mnohem lépe zařadit.
![Zdroj: Seznam.cz](https://mediagurucdneu.azureedge.net/media/oz3noxqf/seznam_graf-4.jpg)
Zdroj: Seznam.cz
Hlavní přínosy nových zájmů
- Vyšší míra prokliku (CTR): Již nyní evidujeme průměrný nárůst CTR o 14 % při ostatních nezměněných podmínkách (podoba či umístění reklam), což znamená, že oslovujeme přesnější a relevantnější publikum.
- Lepší přiřazení uživatelů: Naše nové metody využívají kontext celého textu (nikoli pouze základní tvar slov), čímž umožňují přesnější zařazení uživatelů do správných zájmových segmentů.
- Nepřetržitá optimalizace: Pomocí metody „LLM as a judge“ identifikujeme a odstraňujeme chyby v klasifikaci, což vede k neustálému zlepšování našich modelů.
![Zdroj: Seznam.cz](https://mediagurucdneu.azureedge.net/media/z02a5yxs/graf-5.jpg)
Zdroj: Seznam.cz
Co to znamená pro kampaně?
- Relevantnější návštěvnost: Díky přesnějšímu cílení lze oslovit publikum, které vás skutečně zajímá a má vyšší potenciál ke konverzím.
- Možné zmenšení velikosti některých segmentů: U některých zájmových cílení se mohou segmenty zmenšit, což může ovlivnit celkový počet návštěvníků.
Závěr
Inovace v oblasti cílení, ať už se jedná o socio-demografické nebo zájmové cílení, hrají klíčovou roli v digitální reklamě. Seznam díky využití pokročilých technologií a kontinuálnímu vylepšování svých modelů nabízí inzerentům nástroje, které zaručují vysokou přesnost a efektivitu kampaní. Výsledkem je, že reklamní sdělení zasahují přesně to publikum, které je pro daný produkt či službu nejrelevantnější – což přináší lepší obchodní výsledky a spokojenost zákazníků.
Autor textu: Jiří Udatný, ředitel divize Identity a uživatelského profilu, Seznam.cz