Blog Sklik.cz » Provoz

Odstávka systému z důvodu úpravy databáze

Vážení inzerenti, z důvodu příprav na implementaci podpory rozšířených textových inzerátů do Skliku, bude v pondělí 28.8. od 22:00 do úterý 29.8. 6:00 probíhat odstávka všech rozhraní systému Sklik.

Nedostupné tedy bude administrační rozhraní na www.sklik.cz, partnerské rozhraní partner.sklik.cz i rozhraní api.sklik.cz. V tomto termínu tedy nebude možné jakkoliv nakládat s vaší inzercí ani partnerským účtem. Výdej inzerce přerušen nebude.

Tento krok nám umožní implementaci dalších úprav potřebných k podpoře rozšířených textových inzerátů.

Děkujeme za pochopení.

Tým Sklik

Sklik a podpora Rozšířených textových reklam

Nejnovější verze AdWords Editoru podporuje tzv. Rozšířené textové reklamy a uživatelům je navíc nabízí jako výchozí formát reklamy. Jedná se o zásadní úpravu, Sklik je při importu v tuto chvíli nepodporuje. Abychom PPC specialistům zjednodušili práci a inzerentům zároveň dali více prostoru pro jejich sdělení, rozhodli jsme se úpravu provést také. Nebude to však hned.

Celý příspěvek

Zrušení API verze Bajaja

Před rokem jsme připravili novou verzi API Cipísek a nyní nastal čas na další logický krok – zrušení starší verze Bajaja, která je v provozu již několik let.

Logo API API verze Bajaja je již historickým kusem software, které nezvládá hromadné metody, neumí nová nastavení v Skliku a další funkce. Proto bude tato verze zrušena k 30. říjnu 2015.  Inzerenti, kteří tedy Bajaju stále používají, mají dostatek času na úpravu svých programů. Samotný přechod není nijak náročný, protože obě verze jsou si velmi podobné a liší se jen v detailech. Můžete však začít využívat nové hromadné fukce a další Cipískovy novinky.

Při přechodu na Cipíska věnujte pozornost těmto zdrojům informací: dokumentace v angličtiněpředstavení na našem blogu.

Za celý tým Sklik.cz Jirka Chomát

Nedostupnost statistik za dnešek (10.6.) – aktualizováno

Od dnešních (10. června 2015) ranních hodin nebylo možné přihlásit se do Sklik účtů. Před devátou hodinou bylo rozhraní zpřístupněno. Bohužel se však jedná o rychlé řešení nikoli celkovou opravu.

Statistiky za dnešní den jsou totiž v tuto chvíli nulové a v rozhraní Skliku se objeví až v okamžiku celkové opravy ranní technické chyb. Prozatím nemáme informaci, kdy přesně k opravě dojde.

Velmi se omlouváme za způsobené nepříjemnosti a o termínu opravy vás budeme informovat na blogu, v rozhraní Skliku a na sociálních sítích.

Chceme zdůraznit, že chyba se týká pouze zobrazení statistik za dnešní den. Nijak se tedy netýká běhu inzerátů nebo vytváření kampaní nových.

Aktualizováno v 14:00 – statistiky jsou již kompletní a rychlost výdeje stránek se vrátila do normáního stavu. Děkujeme všem za trpělivost.

Tým Sklik.cz

Test pozic inzerátů Skliku pod výsledky vyhledávání

V rámci zvyšování relevance Skliku pro uživatele ve vyhledávání na Seznam.cz jsme spustili test až 3 pozic pod přirozenými výsledky vyhledávání.

Testovaná varianta výsledků se v tuto chvíli zobrazuje cca 25 % uživatelům hledajícím na Seznam.cz. Poté co získáme dostatečné data, budeme vyhodnocovat optimální formu či další rozšíření testu. Vzhled nových výsledků vyhledávání si můžete prohlédnout na obrázku níže. Spodní pozice se zobrazí, jen pokud by se jinak v pravém sloupci nyní vydaly jedna až tři reklamy. Spodní pozice neobsahují rozšíření Sklik Odkazy.

Do testu se nelze uměle zapojit, ani není možné vyhodnotit změny ve statistikách vašich kampaní.

Testovací varianta výsledků vyhledávání vč. spodních inzerátů Skliku

Testovací varianta výsledků vyhledávání vč. spodních inzerátů Skliku

V případě dotazů se na nás neváhejte obrátit na email sklik@firma.seznam.cz.
Za celý tým Sklik.cz Ondřej Krišica

Nový blog Skliku

Blog Skliku funguje od roku 2006, to byly časy, a protože systém, na kterém původní blog běžel, bude v pondělí zcela vypnut, museli jsme si zřídit nové místo, kde vás budeme pravidelně zásobovat novinkami.

Vítejte na novém blogu, který pohání WordPress. Převedli jsme všechny články i komentáře a většinu článků jsme poladili aby vypadaly dobře i v novém kabátě. Vidíte, kabát, málem bych se zapomněl zmínit, že je responzivní a designem se záměrně podobá inzerentskému rozhraní. Konečně umíme v článích i vyhledávat a máme nové možnosti, které využijeme v dalších článcích.

Screenshot nového blogu na novém blogu

Původní doména a URL jsou přesměrovány na správné místo, ale pokud narazíte na problém, tak nám prosím napište email nebo komentář.

Hezký den přeje Jirka Chomát a celý tým Sklik.cz.

Sklik je i spousta technologie

Jak jste si již určitě všimli, velice podrobně informujeme na blogu o každé novince, kterou nasadíme do webového rozhraní, abychom vám práci s vaším účtem co nejvíce usnadnili.

Sklik není jen webové rozhraní, které používá aktivně skoro 40 tisíc klientů, ale také spousta technologie pro zpracování inzerátů a následně jejich výdej. Právě pokud jde o technologie, tak byly roky 2012 a 2013 pro Sklik velice plodné. Celý systém se změnil k nepoznání a k lepšímu.

Vývojáři Skliku se museli seznámit s novinkami z úplně jiného technologického světa. Na mnoha místech jsme začali používat distribuované řešení (Hadoop). Udělali jsme také velký pokrok díky preciznější aplikaci matematiky a masivnímu nasazení strojového učení.

V následujících několika odstavcích se pokusíme zrekapitulovat zásadní milníky nejen z minulého roku.

Statistiky

V průběhu roku 2012 jsme velmi pilně pracovali na tom, abychom se seznámili se systémem Hadoop pro první velký projekt Redesign statistik. Původní řešení již nezvládalo zpracovávat tak ohromné množství statistických dat a potřebovali jsme změnu. V tomto roce jsme se dokázali s systémem zcela sžít a z problematické komponenty agregace statistik udělat velice stabilní a neomezeně škalovatelnou továrnu na výrobu statistik v podstatě na cokoliv, co je v systému k dispozici. Zanedbáme-li technologickou vyspělost celého systému, přidaná hodnota z hlediska businessu je v tom, že od nasazení máme po ruce data prakticky ihned a navíc taková, jaká chceme. I když pro uživatele nejsou tato data v rozhraní dostupná, my je máme. Bude ještě nějakou dobu trvat, než je zpřístupníme ve webovém rozhraní třeba formou nové metriky, ale pro nás jsou naprosto zásadní z hlediska dalšího rozvoje systému.

Relevance

V lednu 2013 přichází první velký zásah do relevance ve vyhledávání za celou dobu existence Skliku. Měníme výpočet míry prokliku (CTR) pro řazení inzerátů. Již nepočítáme a nenormalizujeme CTR, ale přecházíme na tzv. EC (expected clicks).

Tento koncept jsme úspěšně vyzkoušeli nejprve v obsahové síti a to koncem roku 2012, kde se prokázaly jeho kvality. Proto jsme jej ihned na začátku roku 2013 nasadili do vyhledávání. Provozní AB testování a nasazení trvalo měsíc. Troufáme si tvrdit, že postupnou změnu museli ve svých účtech pocítit všichni inzerenti. Ať již kladně, nebo záporně. Každopádně se více zaměřujeme na kvalitu a tento trend bude pokračovat.

Následující grafy ukazují, jak se změnilo CTR inzeratů.


V obsahové síti byl nárůst CTR větší než 100 %


Ve vyhledávání byl nárůst CTR takřka 80 %.

A zase statistiky

Březen 2013 byl zlomový měsíc z pohledu statistik, a opět si pozorný inzerent mohl všimnout změny. V tomto měsíci jsme zmigrovali statistiky a kompletně je přesunuli do distribuované databáze Hbase. Prakticky to znamenalo migraci dat několika desítek instancí MySQL databáze, ve které byly statistiky uloženy jinam. I ta nejmenší tabulka již byla pro MySQL hodně velká, ani vlastní řešení škálování již nestačilo a v tuto chvíli nutně musela změna technologie přijít.

Cílem redesignu bylo zásadní zrychlení čtení statistik zejména pro velké účty, možnost ukládání dalších metrik a vytváření dalších statistik. Škálování formou přidání dalšího stroje do clusteru bez nutnosti zásahu do databáze je již jen třešničkou na dortu. Migrace na novou technologii dopadla nad očekávání dobře. Dohromady si testování migrace a paralelní běh, kdy jsme sledovali, zda statistiky sedí, vyžádali 2 měsíce pozornosti našich administrátorů a programátorů.

Pro bližší představu s čím se museli naši programátoři a administrátoři vypořádat uvedeme několik čísel:

  • Sklik každý den vydá 180 milionů reklam
  • odpoví na 20 miliónů dotazů
  • pokryje reklamou 35 miliónu partnerských stránek

„Ke každému vydanému inzerátu si musíme pamatovat všechno důležité. Žádná statistika nikdy neexpiruje (pamatujeme si vše do minulosti).“

  • denně vygenerujeme 20 GB dat, které se musí někam uložit
  • velikost statistik pro klienty je asi 700 GB
  • každý den nám do ní přibude zhruba asi 2 GB nových dat
  • do tabulek tedy přibude každý den více než 65 milionů řádků
  • největší tabulka v databázi, kde jsou uloženy statistiky o vydaných reklamách na konktétní url v obsahové síti, je veliká 170 GB a má 3.2 miliardy řádků
  • následuje druhá statistika vyhledávacích dotazů pro klíčová slova má 154 GB3.5 miliardami řádků
  • běžně se vyskytují tabulky statistik o stovkách milionů řádků

O klientské statistiky se nyní stará cluster 20 strojů s nakonfigurovanou kapacitou 120 TB a databází HBase.Čtení statistik velkých účtů, které dělalo největší problémy, zejména pak pro klienty, kteří používali API a pro své externí systémy si potřebovali tahat značné množství dat, se zásadně zrychlilo. Vzhledem k tomu, že se jednalo o pro nás naprosto neznámé využití nové technologie, se kterou máme jen napatrné zkušenosti, dá se to považovat za velký úspěch.

Retargeting

V květnu 2013 jsme poprvé začali pracovat na retargetingu. I když to nemusí být na první pohled patrné, jedná se o poměrně komplikovaný systém, který musí svou podstatou (cílením na uživatele) pěkně zapadnout mezi ostatní komponenty Skliku. Celý projekt se skládal z několika částí a to z úpravy webového rozhraní, počítání statistik, úpravy výdeje, počítání zpětné vazby. Začlenění retargetingového inzerátu mezi inzeráty kontextu znamenalo provést zásadní změny ve výdeji kontextových inzerátů. Tato fáze, dohromady s přípravou webového rozhraní zabrala podstatnou část při implementaci.

„První inzerát přes retargeting se vydal 20.11.2013.“

Retargeting byl spuštěn v neveřejném beta testu, kde jsme ověřovali jeho kvality, dříve než jej dáme volně k dispozici. Testování probíhalo s velkými klienty a trvalo asi 2 měsíce a již v průběhu testu jsme měli pokrytí retargetingem v obsahu okolo 15 %. Nyní je již tento typ cílení dostupný pro všechny klienty a pokud se chcete dozvědět o retargetingu více stačí si přečíst tento článek.

Relevance II

Květen 2013 byl měsíc, kdy jsme začali veřejně testovat nové počítání relevance postavené na rozhodovacích stromech. Celý projekt “lesní relevance” trval asi 6 měsíců a měl za úkol lépe řešit relevanci inzerátů na dotaz. V tomto projektu jsme si poprvé v provozní praxi vyzkoušeli strojové učení, které mělo na relevanci velice pozitivní vliv.

I když si jsme vědomi, že na spousty dotazů ještě zdaleka neumíme najít ty nejlepší inzeráty, měl tento projekt jednoznačně kladný dopad na CTR. V následujících letních měsících jsme systém důkladně sledovali a postupně upravovali klíčové nastavení, kdy jsme nakonec v září dospěli k zásadnímu zjednodušení řazení inzerátů ve vyhledávání podle čistého součinu CTR x relevance x cena. Na nás
ledujícím grafu je vidět CTR ve vyhledávání, které má opět stoupající trend. Relevance zůstává nejen z pohledu našeho výzkumného oddělení nekonečným projektem, a tak na ní pracujeme stále.


Nárůst CTR ve vyhledávání.

Rozdělení hlavní databáze

Další poměrně rozsáhlý projekt, který začal již v roce 2012 a jehož cílem jsou převážně zásahy do architektury, je rozdělení hlavní databáze. Asi není úplným tajemstvím, že Seznam jako úložiště dat svých aplikací používá MySQL a stejně tak je tomu i v případě Skliku. S tím, jak nám do systému přibývají další a další data, je potřeba tato data nějakým způsobem škálovat. Hlavní databáze Skliku (databáze ve které jsou uloženy klientská data, kampaně, sestavy) nebyla navržena tak, aby byla horizontálně škálovatelná.

Opět pro představu uvedu několik čísel:

  • Počet inzerentských účtů je zhruba 70 tisíc
  • V těchto účtech se nachází 500 tisíc kampaní
  • 10 milionů sestav
  • 32 milionů inzerátů
  • a více než 400 milionů klíčových slov
  • největší účet v systému má přes 3 milióny aktivních klíčových slov

„Vypadá to, že všechny velké eshopy mají u nás svá data. Co to je v porovnání třeba s registrem automobilů…?“

Výdejové komponenty již byly designovány před delší dobou a nyní přišla na řadu databáze. Celý projekt trval více než rok, v průběhu kterého jsme museli upravit všechny komponenty závislé na hlavní databázi a přesunu všech dat do databáze nové naškálované struktury. Poslední účet jsme přesunuli první týden v lednu, a pokud jste si ničeho zvláštního nevšimli, jen se vám zdá, že je rozhraní mírně rychlejší, tak je vše v naprostém pořádku.

Plán na rok 2014

Nebudeme prozrazovat, co konkrétně chystáme v Skliku spustit v letošním roce, nechte se překvapit. I tento rok se budeme věnovat všem důležitým částem systému. Přibudou nové funkce do webového rozhraní, přidáme další možností cílení reklamy a opět se zaměříme na “relevanci” reklamy tak, abychom našim klientů přinesli za jejich investované peníze co nejvíce zákazníků.

Za celý tým Skliku, Zdeněk Philipp

Sklik Erotika v uzavřeném beta testu

Možná jste si všimli inzerátů ve výsledcích vyhledávání na Seznam.cz zaměřené na erotické pomůcky, které jen tak v každé lékárně nekoupíte.

Ano je to tak, s několika inzerenty jsme se rozhodli začít testovat reklamu na tento obsah.

Jelikož se jedná o velice citlivé téma, budeme tento obsah bedlivě sledovat a na základě zpětné vazby se pak rozhodneme, jakým způsobem budeme testování rozšiřovat, případně algoritmy, které tuto problematiku řeší, upravovat.

Plánů máme spoustu, a to nejen ve vyhledávání. Vše je však závislé na výsledcích testování, o kterých vás budeme informovat stejně jako o samotném ostrém spuštění pro všechny klienty.

Za celý tým Skliku Zdeněk Philipp

Změna přístupu Skliku ke smazaným datům bez statistik

Vážení inzerenti,

dovolujeme si vás informovat, že ve středu 15.5.2013 dojde ke změně chování systému v případě smazaných dat. Nově bude systém tato data automaticky a pravidelně odstraňovat z inzerentských účtů Skliku. Mazána budou pouze data bez jakýchkoliv statistik. To znamená, že v době své aktivity nenasbírala ani jedno zobrazení.

Pokud kampaň, sestava, inzerát, klíčové slovo nebo umístění bez statistik bude ve stavu „Smazané“ bez přerušení déle než 6 měsíců, bude nenávratně odstraněno z vašeho účtu. Smazané kampaně a sestavy budou odstraňovány bez ohledu na stav inzerátů, klíčových slov a umístění v nich uložených.

Před touto změnou bychom vás chtěli poprosit o kontrolu vašeho Sklik účtu, zda nejsou mezi smazanými kampaněmi, sestavami, inzeráty, klíčovými slovy nebo umístěními položky, které jsou pro vaši inzerci do budoucna důležité. V takovém případě doporučujeme změnit jejich stav na „Pozastavené“ či „Aktivní“.

Tato změna se nikterak nedotkne vámi smazaných dat se statistikami. Bude tedy možné se vždy dostat k potřebným statistikám a případně danou položku obnovit do aktivního stavu.

Cílem této změny je vyčištění databáze a zrychlení systému pro všechny uživatele.

Děkujeme za pochopení.

Za celý tým Skliku Tomáš Richter

Změna řazení inzerátů

21.1.2013 bude ve vyhledávání na Seznam.cz, a na ostatních vyhledávacích serverech, kde se Sklik zobrazuje, probíhat postupné nasazování upraveného řazení inzerátů.

Vážení inzerenti,

dovolujeme si vás informovat, že dnes, 21.1.2013, bude ve vyhledávání na Seznam.cz, a na ostatních vyhledávacích serverech, kde se Sklik zobrazuje, probíhat postupné nasazování upraveného řazení inzerátů. To znamená, že se inzeráty Skliku budou v cca 1/4 případů vydávat s novým nastavením, které může mít v některých případech za důsledek jejich mírně odlišné seřazení.

Vývoj nového řazení trval několik měsíců a byl v minulých týdnech testován interně. Nové řazení inzerátů bude především lépe zohledňovat zpětnou vazbu od uživatelů – tedy chování, kdy uživatelé vyhledávají informace na Seznam.cz a klikají na inzeráty Skliku. Přepracována je i metoda zastavování klíčových slov ve vyhledávání. Systém nyní spolehlivěji pozná slova spouštějící inzeráty, které nejsou pro uživatele zajímavé, a zároveň  bude méně přísný k relevantním klíčovým slovům na nižších pozicích.

Princip toho, že pozici inzerátu určuje součin míry prokliku daného klíčového slova a jeho nabídnutá maximální cena za proklik, zůstává zachován.

Výsledkem všech úprav bude relevantnější seřazení inzerátů Skliku ve vyhledávání, které rychleji a přesněji reaguje na chování uživatelů. Jako inzerenti poznáte změnu především při úpravách kampaní v Skliku. Nově přidaná klíčová slova budou pružněji reagovat na svůj výkon, tedy např. rychleji získají vyšší pozici ve výsledcích, pokud si ji dle výkonu zaslouží. Navíc klíčová slova přesunutá v rámci kampaně nebo účtu výrazně rychleji naváží na výkon ve svém původním umístění a neměli byste tak pozorovat při změnách v kampaních výraznější změny výkonu.

Nové řazení inzerátů by se nemělo výrazněji dotknout dlouhodobě běžících klíčových slov. Pokud byste i přesto v kampaních pozorovali jakékoliv nestandardní chování, budeme rádi, pokud nás kontaktujete na naší Podpoře a situaci podrobně popíšete.

Děkujeme všem za spolupráci. Budeme vás informovat i jakmile dojde k plnému nasazení nového vylepšeného řazení.

Tým Skliku