相信很多SEM推廣人員都知道,百度鳳巢系統(tǒng)的工具中心里有一個(gè)商盾系統(tǒng)。該系統(tǒng)每天會自動(dòng)過濾無效點(diǎn)擊,被過濾的無效點(diǎn)擊不收費(fèi)。那么百度判定無效點(diǎn)擊的規(guī)則到底是什么呢?其實(shí)這里就用到了,百度統(tǒng)計(jì)里大家經(jīng)常會關(guān)注到的一個(gè)東東“訪客標(biāo)識碼”。最近文武雙全在學(xué)習(xí)PHP的過程中,對這個(gè)訪客標(biāo)識碼有了進(jìn)一步的了解。思考了很久,今天就跟大家分享一下我的經(jīng)驗(yàn)心得吧。

百度統(tǒng)計(jì)的訪客標(biāo)識碼官方概念

在百度統(tǒng)計(jì)后臺并沒有對“訪客標(biāo)識碼”概念的說明,但是百度統(tǒng)計(jì)的幫助中心里,倒是有一個(gè)簡單的介紹。訪客標(biāo)識碼是標(biāo)記訪客唯一身份的一串符號,類似于訪客身份證。

這個(gè)概念說明非常的模糊,說了等于白說。根據(jù)文武雙全的進(jìn)一步的實(shí)驗(yàn),慢慢揭開了這個(gè)訪客標(biāo)識碼的真面目。

訪客標(biāo)識碼是基于瀏覽器的

這個(gè)實(shí)驗(yàn)做起來很簡單:同一臺電腦,用兩個(gè)不同類型的瀏覽器訪問同一個(gè)網(wǎng)頁,就會發(fā)現(xiàn)自己的訪客標(biāo)識碼已經(jīng)發(fā)生了變化??蛻敉ㄟ^瀏覽器訪問網(wǎng)頁后,百度統(tǒng)計(jì)的JS腳本會通過GET請求獲得瀏覽器的版本信息。稍微有點(diǎn)web開發(fā)知識的人,會發(fā)現(xiàn)這個(gè)訪客標(biāo)識碼實(shí)際上跟cookie很像,或者說他就是一個(gè)cookie。

更精準(zhǔn)一點(diǎn)的設(shè)置是,將操作系統(tǒng)版本、瀏覽器版本、屏幕分辨率、屏幕顏色等都作為參數(shù)。如果訪客僅僅是用VPN改變了自己的IP地址,但是本地的操作系統(tǒng)等參數(shù)并未改變的話,依然可以確立他的身份。

僅僅根據(jù)瀏覽器的信息來生成訪客標(biāo)識碼的話,服務(wù)器需要生成更多的訪客標(biāo)識碼,會帶來額外的服務(wù)器開銷。好處則是,對訪客的標(biāo)識會更加的靈敏。

根據(jù)百度推廣搜索詞分配訪客識別碼

同IP同操作系統(tǒng)同分辨率同瀏覽器訪客識別碼不同

如圖所示,該訪客一天內(nèi)六次通過搜索高價(jià)詞進(jìn)入文武雙全的競價(jià)網(wǎng)站。百度統(tǒng)計(jì)顯示該訪客的信息:

1,IP地址為同一個(gè)IP;

2,瀏覽器均為遨游瀏覽器;

3,屏幕分辨率均為1366*768;

4,屏幕顏色均為32-bit色;

5,操作系統(tǒng)均為win8;

6,惡意點(diǎn)擊時(shí)間為同一天;

7,nginx的網(wǎng)站日志里也沒有顯示其使用了代理,IP地址為真實(shí)IP;

但是訪客識別碼并不相同,顯然訪客識別碼還有其他未知參數(shù)。唯一不同的就是客戶的搜索詞,連續(xù)三次搜索了同一個(gè)搜索詞,百度統(tǒng)計(jì)給與的訪客識別碼是相同的。但是隔了一段時(shí)間搜索了其他詞以后,再搜索之前的搜索詞,給出了并不一樣的訪客識別碼。由此可見,百度給予相同IP多次訪問,給予訪客識別碼的幾率非常的高。

文武雙全猜測,為了配合百度鳳巢系統(tǒng)的商盾更加精準(zhǔn)的識別惡意點(diǎn)擊。訪客識別碼增加了一個(gè)條件判斷語句,如果客戶是通過百度搜索過來的,則根據(jù)搜索詞分配不同的訪客識別碼。不同時(shí)間段搜索相同的搜索詞,分配不同的訪客識別碼。

這個(gè)cookie信息只在百度統(tǒng)計(jì)后臺顯示

文武雙全找了好多天,在各個(gè)版本瀏覽器的header信息里都沒有找到這個(gè)cookie??赡苁浅鲇诎踩目紤],訪客標(biāo)識碼只在百度統(tǒng)計(jì)的后臺顯示。

參數(shù)不變訪客標(biāo)識碼不變

上文提到訪客標(biāo)識碼是基于瀏覽器版本等參數(shù)的,如果這些電腦信息不發(fā)生變化的話,訪客標(biāo)識碼是長期有效不會發(fā)生變化的。這對于確定用戶的身份,是非常有用的。同一局域網(wǎng)內(nèi),相同IP不同電腦的身份也可以由此確立。

如果積累大量歷史訪問數(shù)據(jù),長周期內(nèi)發(fā)現(xiàn)某訪客經(jīng)常更換IP地址點(diǎn)擊百度推廣廣告,則是惡意點(diǎn)擊無疑??啾频氖牵俣冉y(tǒng)計(jì)只有十天的記錄。

訪客標(biāo)識碼是百度商盾防惡意點(diǎn)擊的核心參數(shù)

百度統(tǒng)計(jì)的官方幫助中心明確提示,如果在同一時(shí)段,出現(xiàn)了訪客標(biāo)識碼相同,但是IP地址不同,通常是惡意點(diǎn)擊。這類惡意點(diǎn)擊,統(tǒng)計(jì)只是將所有到訪的情況作了記錄,但是風(fēng)潮系統(tǒng)的后臺并未計(jì)費(fèi)。由此可見,訪客標(biāo)識碼是百度商盾防惡意點(diǎn)擊的最為重要的參數(shù)。

文武雙全猜測百度商盾防惡意點(diǎn)擊的策略

根據(jù)文武雙全對百度統(tǒng)計(jì)和百度商盾防惡意點(diǎn)擊的實(shí)時(shí)監(jiān)控,我個(gè)人猜測百度商盾防惡意點(diǎn)擊的策略有如下幾種:

策略一,在特定時(shí)間段(比如說1個(gè)小時(shí)內(nèi)或者半個(gè)小時(shí)內(nèi)),訪客標(biāo)識碼相同,IP地址不同的點(diǎn)擊全部視為惡意點(diǎn)擊;

策略二,在特定時(shí)間段,訪客標(biāo)識碼相同,IP地址相同的部分點(diǎn)擊視為惡意點(diǎn)擊;

百度商盾的后臺,有一級過濾點(diǎn)擊量和二級過濾點(diǎn)擊量兩個(gè)過濾級別。目前來看,策略二過濾的惡意點(diǎn)擊,都是歸類到一級過濾中的。

百度商盾防惡意點(diǎn)擊系統(tǒng)的缺陷

先進(jìn),該系統(tǒng)是基于瀏覽器也就是訪客標(biāo)識碼的,如果更換瀏覽器并且使用VPN惡意點(diǎn)擊的話,商盾系統(tǒng)無效;

第二,遠(yuǎn)程連接到服務(wù)器,利用服務(wù)器的VPN進(jìn)行惡意點(diǎn)擊的行為,商盾系統(tǒng)無效;

第三,對于分布式的人為惡意點(diǎn)擊,由于IP地址和瀏覽器都不同,商盾系統(tǒng)無效;

第四,對于周期較長的惡意點(diǎn)擊,商盾系統(tǒng)很無力;

第五,百度統(tǒng)計(jì)的訪客標(biāo)識碼只保留十天,通過歷史數(shù)據(jù)挖掘惡意點(diǎn)擊很無力;

由此可見,做百度推廣的企業(yè),引進(jìn)更為先進(jìn)的防惡意點(diǎn)擊系統(tǒng)是非常有必要的。企業(yè)可以通過開發(fā)自己的防惡意點(diǎn)擊系統(tǒng),來增加對在線廣告系統(tǒng)的保護(hù)。僅僅依靠百度自身的防惡意點(diǎn)擊系統(tǒng),是絕對不夠的。

 

•END•