日归档:2008 年 09 月 09 日

淘宝屏蔽百度爬虫 新一轮C2C之战一触即发

      Robots.txt作为一个存放于网站根目录下的文本,通常只有搜索引擎的爬虫程序才会光顾这个文件,用来辨别这个网站内容是否可以被全部或部分抓取。然而最近淘宝网站的Robots.txt引起了业内的普遍关注,因为淘宝的Robots.txt直接屏蔽了来之百度的搜索爬虫。

发表在 互联网, 电子商务 | 标签为 , | 2 条评论