大家都知道大概是“百度有啊”上線之前,淘寶網(wǎng)為了避免百度惡意抓取,直接屏蔽了百度蜘蛛,也就是當(dāng)時(shí)鬧得沸沸揚(yáng)揚(yáng)的robots.txt協(xié)議 。
就算是現(xiàn)在打開淘寶的robots.txt協(xié)議,依然可以看到淘寶還在屏蔽百度的蜘蛛。
可是事實(shí)上真的如此么
事實(shí)證明淘寶的robots.txt文件根本對(duì)百度蜘蛛起不到任何作用。
小弟推測百度之所以這么做是因?yàn)榘俣瓤紤]到戰(zhàn)略方向的問題,因?yàn)椴樵兞艘幌掳l(fā)現(xiàn)一些知名店鋪在百度的排名都很不錯(cuò)。足以證明百度對(duì)淘寶這種店鋪的重要性。更加戲曲化的是天貓網(wǎng)(淘寶商城)也是使用robots.txt協(xié)議的。同樣屏蔽了百度蜘蛛。
還有一種可能就是淘寶網(wǎng)以及天貓網(wǎng)的權(quán)重太高了,導(dǎo)致了百度蜘蛛不遵循搜索引擎協(xié)議而進(jìn)行的抓取。不過對(duì)于這種事情可以聯(lián)想到前些日子,一淘網(wǎng)惡意抓取京東商城以及新蛋網(wǎng)等的商品數(shù)據(jù),也是不遵循搜索引擎規(guī)則的。
直到現(xiàn)在京東商城等也在屏蔽一淘網(wǎng)的蜘蛛,
小編想說的是現(xiàn)在的搜索引擎為了自身利益而不遵循互聯(lián)網(wǎng)協(xié)議的規(guī)則,是值得反思的,呼吁這種互聯(lián)網(wǎng)大公司能在整個(gè)IT行業(yè)樹立標(biāo)榜。