互聯(lián)網(wǎng)搜索廣告技能升級版,趕緊get起來
來源(廣告買賣網(wǎng)) 作者() 閱讀() 時間(2015/7/24 10:03:55)
正排數(shù)據(jù)存儲的是推廣組(ad-group)、推廣計劃(campaign)和客戶(cust)的相關(guān)信息,如寶貝狀態(tài),銷量,屬性,類目,地域,以及推廣計劃的id,客戶的id等。對候選集合的過濾就是根據(jù)正排數(shù)據(jù)來進行的。檢索過程只負(fù)責(zé)檢索出購買了這些競價詞的廣告。根據(jù)正排數(shù)據(jù)來進行過濾的過程是由單獨的一個階段來完成的。
可以看到在搜索廣告中檢索過程是十分簡單的,其實是一個精確匹配的結(jié)果,不像網(wǎng)頁搜索引擎,需要支持多種語義
二、廣告排序(Ranking)
檢索完成后,就需要確定廣告的輸出順序,需要兼顧用戶體驗和搜索平臺的收益。這個階段必須綜合考慮競價和相關(guān)性分?jǐn)?shù)(例如ecpm)。目前有兩種主流的方法,以賽馬為例:
反應(yīng)式(Reactive):選定一匹馬,根據(jù)它的歷史成績來預(yù)測未來的表現(xiàn)
預(yù)估式(Predictive):根據(jù)體重,腿長等特征為賽馬建模,找到這些特征在預(yù)測比賽名次終的重要程度,然后基于這些特征來給見過、未見過的賽馬預(yù)測成績。
當(dāng)我們擁有對某賽馬的足夠信息的時候,就使用這些信息(反應(yīng)性),否則使用模型(預(yù)測性)。
。ㄒ唬┓謱优判
記得計算機界某大牛曾經(jīng)說過,任何問題都可以通過增加一層來解決,在廣告搜索引擎中也是通過分層的形式解決復(fù)雜問題的,大到匹配(Matching)和排序(Ranking),小到廣告集合的處理,無處不在分層的思想。
在廣告搜索引擎中,由海選、初選和精選三個階段來配合完成廣告的排序工作,其中海選和初選都是在做剪枝操作,盡量縮小問題的規(guī)模。廣告和自然搜索的差異之一,就在于廣告位相對自然搜索的位置,是相當(dāng)少的。所以決定了在競爭激烈的情況下,排在后面的廣告是沒有機會展現(xiàn)的。因此可以考慮在早期過程就發(fā)現(xiàn)這些寶貝,然后干掉這些寶貝,此時每個寶貝的排序分?jǐn)?shù)不需要非常精確,能達(dá)到一定的篩選效果就可以,這就是全量索引截斷、海選和初選的思想。而最精確的打分,是發(fā)生在精選階段的。一般都會采用單獨的線上打分服務(wù)來完成的。
。ǘ┤克饕財
全量建索引的時候,會對倒排鏈超過一定數(shù)量的熱詞進行截斷,根據(jù)排序分?jǐn)?shù)來取這個倒排鏈下的top N個寶貝。
海選
廣告搜索是輕檢索,重過濾的。當(dāng)檢索階段拿到的廣告候選集合后,會進行海選。海選這個名稱非常形象,這不就是歌手大賽的海選階段嗎?只有實力唱將才能脫穎而出。
初選
為了減少對線上打分服務(wù)的壓力,海選階段完成后,還需要經(jīng)歷初選階段。