Monthly Archives: 十月 2007

由G.cn到Facebook.cn谈国外网站的中国本土化

近日谷歌正式启用G.cn域名,用户可直接通过G.cn访问谷歌网站,目前谷歌在中国除了Google.cn以及G.cn外,Guge.cn和Guge.com也同样指向谷歌中文网站。对于谷歌中国的“快捷键”,是否被中国网民接受,还有待时间来考验,但谷歌此举应该是谷歌中国本土化进程中的一个重要里程碑。 今天也看到美国脸谱网站Facebook.com将Facebook.cn收入囊中的消息。

Posted in 互联网 | Tagged | 1 Comment

出售付费链接是不可取的

今天,打开自己的博客,发现谷歌的PR终于更新了,距离谷歌上次更新PR已经好几个月了,对于谷歌延长更新评估PR值周期的做法,显示是每一位SEOer不愿看到的,同时最近也有一些关于谷歌制裁出售付费链接的网站降低其PR值的消息,可见谷歌要还互联网公平的决心,同样也告诫SEOer不要走捷径,还要脚踏实地,还要有耐心。

Posted in 互联网, 搜索引擎 | 1 Comment

中国电子商务的“ESE”时代即将到来

      本月17日,百度宣布将进军C2C市场,百度此举,将改变中国的C2C市场格局,正如我在上篇文章中提到的产品搜索引擎将改善用户的购物体验,高处不胜寒的中国C2C老大淘宝也将迎来久违的激情碰撞。

Posted in 互联网, 搜索引擎, 电子商务 | Tagged | Leave a comment

产品搜索引擎开辟网上购物捷径

        产品搜索是电子商务和搜索引擎结合的产物,人们对网上购物的逐步认可,以及使用搜索引擎获取信息的便捷方式决定了产品搜索必将成为搜索引擎的主要用途之一。         产品搜索对信息的精度要求高于普通的网页信息搜索,作为谷歌、雅虎这样的第三方搜索引擎,产品信息来自不同类型的电子商务网站,要将这些信息源整合,最后提供给搜索用户统一风格的产品信息。主流搜索引擎目前也逐步将产品搜索列为重点,从谷歌公司忍痛将使用了5年之久的froogle品牌,更名为 Google Product Search,足以表明谷歌要发展产品搜索的决心。另外,阿里巴巴和搜索巨头雅虎联姻之后,双方资源和技术优势的互补,也为产品搜索开辟了一个广阔的市场,借助阿里巴巴的资源优势,相信雅虎中国的产品搜索短期内应具备一定的优势。         如果只有一个阿里或淘宝,第三方产品搜索也就没有存在的价值,索性还有他们的竞争对手存在,因此,电子商务市场的多元化、扁平化将是产品搜索存在和发展的前提。用户通过产品搜索获取产品信息,省去了频繁周转于几个购物网站对产品价格的比对。同时,产品搜索也为第三方支付和第三方信用评估提供了新的市场空间。         整合多个网站的产品信息,对基于爬虫技术的第三方搜索引擎还是具有相当难度的,本人认为推出类似RSS的产品信息内容格式标准,是解决网站信息兼容的一个手段,只要每个电子商务网站都在生成产品信息的同时也生成面向搜索引擎的信息格式文件,搜索引擎就会迅速检索并处理这些产品信息。         目前,阻碍产品搜索的因素,本人觉得不是技术因素也不是市场需求因素,而是利益如何分配,搜索引擎盈利主要通过PPC(竞价广告),而电子商务网站盈利主要通过会员和服务的收费,如果直接通过搜索找到产品,通过第三方支付或物流完成交易,势必会削弱电子商务网站的流量和服务重要性。因此,如何实现双赢是产品搜索引擎需要突破的最后屏障。

Posted in 搜索引擎, 电子商务 | Leave a comment

解读robots.txt

       robbots.txt是一个只针对搜索机器人也叫爬虫程序(spider)的解释性文本文件。通常搜索机器人抓取一个网站的内容前,会先检测网站根目录下是否存在robots.txt,如果文件存在,搜索机器人会读取robots.txt文本内容,robots.txt文件的作用是告诉搜索机器人,网站哪些目录或文件内容不需要被搜索引擎收录。如果搜索机器人未在网站根目录下找到robots.txt文件,则将按网页链接抓取内容。       编写robots.txt文件时,robots.txt文件名本身必须是小写字母。robots.txt文件中用User-Agent元素标记适用的搜索机器人,例如:Googlebot,Baiduspider等,robots.txt文件中用Disallow元素声明哪些文件或目录不需要被搜索引擎搜录。       下面的几行代码是百度的robots.txt文件内容,从这个示例中不难看出百度用两个User-Agent条目,百度分别对自己的搜索机器人和所有的搜索机器人声明了不需要被收录的目录和文件: User-agent: Baiduspider Disallow: /baidu User-agent: * Disallow: /shifen/dqzd.html        从网站优化的角度看还是有必要为网站建立robots.txt文件的,可将不需要被用户查看的后台登录或维护等页面在搜索引擎中隐去,一方面增加了安全性,另一方面也令通过搜索引擎访问的用户能更准确地到达有效页面。如果你懒得去打开记事本编辑robots.txt,还可以通过一些网站提供的robots.txt在线生成工具,来轻松创建自己的robots.txt文件。

Posted in 搜索引擎 | Leave a comment