四大搜索引擎宣布支持主动发现sitemap
为了支持和推动sitemap协议,sitemap的结盟成员Google、Yahoo、Msn于去年11月推出了sitemaps.org(国内访问可能需要代理),这个功能主要是为了让站长们更为清楚的告诉搜索引擎应该什么时候索引,什么时候更新了,应该索引哪些内容等,方便站长与搜索引擎中间架设一道桥梁。 现在世界上四打搜索引擎宣布不用再收工提交,只需要在网站的robots.txt文件中加入,示例: Sitemap: http://www.seoer.ha.cn/sitemap.xml 注意:请将seoer.ha.cn换成你的网站地址。当然,后面的sitemap.xml文件,也可以使用自己的文件名路径,需要完整的路径。 这样,搜索引擎就会主动寻找你的sitemap文件,从而获得有用信息。 支持这一功能的搜索引擎包括www.google.com、www.yahoo.com、www.msn.com、www.ask.com ,主要针对是英文,当然,中文同样支持拉。 ps:个人建议,这些还是在网站初期比较适用,一旦数据量增加,搜索引擎收录稳定,就取消sitemap功能吧,不然有可能搜索不完全。不过,如果有特殊需要,例如,需要用到Google webmaster中的查看链接等等。这些还是可以的。
探索SEO与电子商务之间的关系
电子商务这个词应该是2007年互联网最hot的词之一,随着阿里巴巴的上市,越来越多的人都聚焦在电子商务这个链条中。从现在情况来看,更多的搜索引擎优化的老鸟们都投身到电子商务这个环节中,本文不是说明方法,而是希望探索一些SEO与电子商务之间更多的一些特性和本质。 对搜索引擎优化,相信对点石比较熟悉的人都有比较清晰的认识。而对于电子商务,很多人认为就是买卖东西而已。这样的理解就导致了很多人做电子商务将搜索引擎优化摆放到一个前所未有的高度。认为只有排名高,就会有产出,或者是砸钱去做,就能ok。想想几年前的阿里,当时有很多人将所谓的阿里的优化方式抬举到一个前所未有的高度,认为他们就是电子商务与SEO相互结合的优良产物,而在降权风波以后,很多人又认为阿里的方式应该遭到唾弃。但当时模仿阿里巴巴的人何止一个,有那么多站,为什么还是阿里笑到了最后? 如果按照程序中的存储的观点,个人认为,电子商务重要的是整个电子商务环节链条,整个环节分为三个部分,售前:主要完成用户的导入,用户的信息存储,包括对用户需求的满足,换种通俗点的说法,就是说要让用户来到你的页面,然后获得他想要看到的内容,产生购买的欲望。而售中就是一般说的支付、物流问题,售后就是产品的质量问题,以及一些品牌回馈的机制等。 让我们来看看,SEO究竟在这个巨大的产业链条里能做几个部分,其实就2个部分,第一,引导用户进入相关页面,第二,售前的一些品牌的建立与售后的一些反馈的置顶。如果从营销观点(marketing concept)来说,SEO能实现部分组织目标的关键点在于正确确定目标市场的欲望和需要,并且比竞争者更有效地满足了顾客的欲望和需要。但SEO不是全部,他只能说是一种手段。要完整整个电子商务环节链条,并不是那么容易的事情。 SEO与电子商务之间的关系,现在来看,是一种从属关系,SEO属于营销的一种实施方式,而非营销的全部,因为只有营销的电子商务并不完整,而SEO能极大的初始化整个电子商务生物链条的核心底层。所以,如果想靠SEO来引导电子商务的朋友,希望能从各个环节去考虑,整体的看待整个营销的方式,将重心逐渐移到营销的顶层,从概念上去诠释整个电子商务,而不是简单的SEO等同于电子商务。
基本搜索引擎优化策略
为什么有的网站能在搜索引擎上排名很好,而有的却连找到找不到呢?这个秘密何在呢?正如免费搜索引擎上的指导方针所说,有五个因素你是必须铭记于心的: 1、 你网站的内容与主题。 2、 每页的关键字数。 3、 关键字放置的位置。 4、 点击量。 5、 链接数量。 1、 搜索引擎优化策略:网站内容 网站的实际内容是你网络优化策略的一个重要的因素。如果你想你的网站能在搜索结果中排得靠前,在你的网站中必须有实际的内容。搜索引擎的蜘蛛基本上是一个瞎子。他们只能对你网页内容进行判断你网站的质量,而不能从图片、flash动画上判断。在所有的页面中有充足的内容给搜索引擎进行索引是一个成功搜索引擎优化策略的基本需要。很容易明白,为什么一个没什么内容的网站很难排上去。人们在查找信息的时候,总是希望找到一个包括很多重要信息的网站。很自然,网页内容丰富的网站要比那些网页内容还那么丰富的网站排名要好得多。每个为他们的网站进行优化的站主牢记。不要忘记更新你的网站。无论是搜索引擎还是访问者都希望看到比较新的信息。这是什么意思呢?这就要求你要收集大量的信息,专注于这领域的变化。 2、搜索引擎优化策略:关键字密度 网页上通常会有数以百计的词语,那么搜索引擎怎样去分辨哪些是描述你的网站的重要的词语呢?搜索引擎会统计你一个页面的字数。那些重复出现的词或短语被认为比较重要些。搜索引擎利用自身的算法来统计你页面中每个字的重要程度。关键字数与该页面字数的比例称为关键字密度,这是一个搜索引擎优化策略最重要的一个因素。 为了得到更好的排名,你的关键字必须在页面中出现若干次,或者在搜索引擎允许的范围内。 怎样才能知道关键字的密度是多少才能得到较好的排名呢?很简单,只要你在搜索引擎中搜索你要优化的关键字,然后统计一下排在前面几个网站该关键字的密度就可以了。当然也有很多统计关键字密度的工具(你可以在本站上找到)。 3、 索引擎优化策略:突出关键字 在有价值的地方放置关键字,当你统计完你的页面需要多少个关键字后,接下来就是考虑把你的关键字放在网页的什么地方。突出关键字是吸引搜索引擎注意的一个最重要的因素。搜索引擎将会专注于你网页中某一部分的内容,处于这一关注部分的词语显得比其他部分的词语要重要得多。这就是所谓的“突出关键字”。 A: Title 和meta 标签:在上一节已经提到,title 标签是网页中最重要的标签。所以在title中放置关键字显得非常重要。有一些搜索引擎会额外的注意“描述”与“关键字”标签。 B: 标题(headings)
GOOGLE排名 如何用关键字优化网站?
搜索引擎使用关键字的相关程度来决定网页的先后顺序。例如,如果有人搜索" butterbeans ”,那么一个标题为" The Butterbean Bazaar ”、里面有十余处单词" butterbeans ”的网页,可能就会排在搜索结果顶端;而那种只出现了一两次" butterbeans ”的网站,则排列在稍后的地方;网站上有" beans ”单词的,就排在更后面的地方;只有" beanless ”这样的单词的网站,则根本不会出现在搜索结果中。每个搜索引擎,都有它自己的排列搜索结果的公式,而且它们被作为机密保存起来。但基本规则是,一个网页出现某个关键字的次数越多,那么,该网页与关键字的相关程度就高,该网页在搜索结果中的排列位置就越靠前。另外,网页标题、章节标题中的关键字,相关程度更高。 知道了这个规则,很多"聪明人”就在他们的网页上,布置大量" mp3 ”、" free ”之类的热门词汇。有些文章更介绍了诸如"隐形文本”、"隐藏关键字”等提高排名的作弊技巧,这些招数被大量甚至疯狂使用,使搜索引擎的查阅效果大打折扣。显然,如果大家都这样做,那么,搜索引擎迟早会变得毫无用处。到了某天,说不定不管你搜索什么,得到的总是色情网站。所以,搜索引擎展开了一场反作弊的斗争。只要它们怀疑你在有意"制造”关键字,那么,就可能取消你的注册。 例如,现在,很多搜索引擎不接受使用"隐形文本”网站的注册。 其实,"关键字”的使用,犹如一把"双刃剑”,一方面,为了使网站在搜索引擎的排名靠前,你的网页应该包含尽量多的关键字,但是另一方面,一旦过度,你就可能面临取消注册资格的危险。所以,前面我们说,向搜索引擎注册并不是首要任务。真正关键的,除了网站本身要有好的内容、产品或服务及设计效果外,就是使你的网页与搜索引擎友好相处,说白了,一要适当使用关键字,二要避免"冒犯”搜索引擎,不要使用那些容易让它"误会”的设计技术,例如,框架和某些动态网页注册。那么,如何使用关键字才算适当呢? 找出人们搜索你的这类网站时,可能使用的所有词汇(关键字),并将它们尽可能地串起来,给你的网站写个简短的描述。例如,如果你要销售 butterbeans (棉豆),并且你已经列出了下面的关键字: Butterbeans Beans Lima beans Biscuits Southern cooking 你可以这样写描述: " We sell butterbeans and lima beans, which taste great with biscuits and other Southern cooking. Free butterbean recipes and a butterbean discussion forum 。” 注意,如何组合重要的关键字(事实上,你的关键字列表可能更长,可以将其中重要的串起来),如何将最重要的那个(如 butterbeans )用上两次。但是,这个描述读起来应该跟普通句子一样,不要只是一个关键字列表。 这个网站描述会用在好几个地方,因此多话一些精力写好它,是值得的。当你向搜索引擎注册的时候,需要填网站描述,当人们搜索到你的网站的时候,这个描述也会出现,所以,要尽量利用它,吸引人们浏览你的网站,但不要简单使用夸大性的词句。另外,网站描述(或将其修改后)还应该放在 TITLE 标记中。 TITLE 标记位于 HTML 网页的 →
Robots.txt指南
当搜索引擎访问一个网站时,它首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件。Robots.txt文件用于限定搜索引擎对其网站的访问范围,即告诉搜索引擎网站中哪些文件是允许它进行检索(下载)的。这就是大家在网络上常看到的“拒绝Robots访问标准”(Robots Exclusion Standard)。下面我们简称RES。 Robots.txt文件的格式: Robots.txt文件的格式比较特殊,它由记录组成。这些记录通过空行分开。其中每条记录均由两个域组成: 1) 一个User-Agent(用户代理)字符串行; 2) 若干Disallow字符串行。 记录格式为: “:“ 下面我们分别对这两个域做进一步说明。 User-agent(用户代理): User-agent行(用户代理行) 用于指定搜索引擎robot的名字,以Google的检索程序Googlebot为例,有:User-agent: Googlebot 一个robots.txt中至少要有一条User-agent记录。如果有多条User-agent记录,则说明有多个robot会受到RES标准的限制。当然了,如果要指定所有的robot,只需用一个通配符“*“就搞定了,即:User-agent: * Disallow(拒绝访问声明): 在Robots.txt文件中,每条记录的第二个域是Disallow:指令行。这些Disallow行声明了该网站中不希望被访问的文件和(或)目录。例如“Disallow: email.htm“对文件的访问进行了声明,禁止Spiders下载网站上的email.htm文件。而“Disallow: /cgi-bin/“则对cgi-bin目录的访问进行了声明,拒绝Spiders进入该目录及其子目录。Disallow声明行还具有通配符功能。例如上例中“Disallow: /cgi-bin/“声明了拒绝搜索引擎对cgi-bin目录及其子目录的访问,而“Disallow:/bob“则拒绝搜索引擎对/bob.html和/bob/indes.html的访问(即无论是名为bob的文件还是名为bob的目录下的文件都不允许搜索引擎访问)。Disallow记录如果留空,则说明该网站的所有部分都向搜索引擎开放。 空格 & 注释 在robots.txt文件中,凡以“#“开头的行,均被视为注解内容,这和UNIX中的惯例是一样的。但大家需要注意两个问题: 1) RES标准允许将注解内容放在指示行的末尾,但这种格式并不是所有的Spiders都能够支持。譬如,并不是所有的Spiders都能够正确理解“Disallow: bob #comment“这样一条指令。有的Spiders就会误解为Disallow的是“bob#comment“。最好的办法是使注解自成一行。 2) RES标准允许在一个指令行的开头存在空格,象“Disallow: bob #comment“,但我们也并不建议大家这么做。 Robots.txt文件的创建: 需要注意的是,应当在UNIX命令行终端模式下创建Robots.txt纯文本文件。好的文本编辑器一般都能够提供UNIX模式功能,或者你的FTP客户端软件也“应该”能够替你转换过来。如果你试图用一个没有提供文本编辑模式的HTML编辑器来生成你的robots.txt纯文本文件,那你可就是瞎子打蚊子——白费力气了。 对RES标准的扩展: 尽管已经提出了一些扩展标准,如Allow行或Robot版本控制(例如应该忽略大小写和版本号),但尚未得到RES工作组的正式批准认可。 附录I. Robots.txt用法举例: 使用通配符“*“,可设置对所有robot的访问权限。 User-agent: * Disallow: 表明:允许所有搜索引擎访问网站下的所有内容。 User-agent: * Disallow: / 表明:禁止所有搜索引擎对网站下所有网页的访问。 User-agent: * Disallow: /cgi-bin/Disallow: /images/ 表明:禁止所有搜索引擎进入网站的cgi-bin和images目录及其下所有子目录。需要注意的是对每一个目录必须分开声明。 User-agent: Roverdog Disallow: / 表明:禁止Roverdog访问网站上的任何文件。 User-agent: Googlebot Disallow: cheese.htm 表明:禁止Google的Googlebot访问其网站下的cheese.htm文件。 上面介绍了一些简单的设置,对于比较复杂的设置,可参看一些大型站点如CNN或Looksmart的robots.txt文件(www.cnn.com/robots.txt www.looksmart.com/robots.txt) 附录II. 相关robots.txt文章参考: 1. Robots.txt常见问题解析 2. Robots Meta Tag的使用 3. Robots.txt检测程序 Robots.txt常见问题解析: 我们开发了一个针对robots.txt文件的“验检程序”,同时又设计了一个搜索程序,专门下载robots.txt文件,以此对新推出的这个“robots.txt验检程序”进行测试。在对DMOZ(ODP)中所链接的站点进行遍历,共计检索240万个站点后,我们总共找到了大概75k的robots.txt文件。 在这些robots.txt文件中,我们发现了大量的而且是形形色色的问题。有超过5%的robots.txt文件使用了错误格式,有超过2%的文件由于使用的是极其拙劣的格式而导致无法为任何SPIDER读取。我们将发现的一些问题在下面列出来供大家参考借鉴: 错误1—语法混用 例如: User-agent: * Disallow: scooter 正确语法应为: User-agent: scooter Disallow: * 错误2—一行Disallow声明多个目录 这是一个比较常见的错误。我们发现很多网站在其robots.txt中,在一个Disallow指令行中放入了多个目录。譬如:Disallow: /css/ /cgi-bin/images/ 绝大多数的spiders对上述声明行都无法做出正确的解析,有些Spiders会忽略其空格而解析为/css//cgi-bin//images/,或只解析/images/或/css/,或者根本不予解析。 正确的语法应为: Disallow: /css/ Disallow: /cgi-bin/ Disallow: /images/ 错误3—在DOS模式下编辑robots.txt文件 这也是一个比较常见的错误。正确的做法应该是在UNIX模式下编辑你的robots.txt文件并以ASCII码格式上传。显然并非所有的FTP客户端软件都能够天衣无缝地将文件格式转换为UNIX命令行终端,所以在编辑robots.txt文件时,一定要确保你的文本编辑器是在UNIX模式下。 错误4—在指示行末尾加注 在robots.txt文件中,凡以“#“开头的行,均被视为注解内容,这和UNIX中的惯例是一样的。例如:Disallow: /cgi-bin/ # this bans robots from our cgi-bin 虽然根据RES标准,在指示行的末尾加注是可行的,但这种格式在过去却并非所有的Spiders都能够支持,有些Spiders干脆就把整个句子视为注解内容直接跳过去不读。当然我们知道现如今搜索引擎基本上都能够支持这种格式,不过—仍有可能无法被某些搜索引擎正确解读,你冒得起这个险吗?我们建议在编辑robots.txt文件时,最好让注解自成一行。 错误5—指令行前有空格 例如“Disallow: /cgi-bin/“,虽然RES标准并未对这种格式予以特别说明,但我们对这种格式是持极力反对态度的。同样的问题摆在你面前你冒得起无法被Spiders正确解读的险吗? 错误6--404重定向至另一页面 一般没有robots.txt的网站会将对robots.txt文件的调用请求转至另一页面。这种重定向通常不会产生服务器状态错误或重定向状态信息。然而因为是Spiders自己决定它看到的是robots.txt文件还是一个.html文件。虽然理论上应该不会有什么问题,不过为了保险起见,不妨在你服务器的顶级目录下放一个空的robots.txt文件。在www.google.com/bot.html下,也提供了相同的建议—“如欲避免网络服务器日志中的出错信息‘找不到文件’,可在其根域下创建一个空的robots.txt文件。” 错误7—声明自相矛盾 例如: USER-AGENT: EXCITE DISALLOW: 虽然RES标准忽略大小写(Case Sensitive),但目录和文件名却是大小写敏感的。所以对于“USER-AGENT“和“DISALLOW“指令,用大小写都是可以的。但对于所声明的目录或文件名却一定要注意大小写的问题。 错误8—列出所有文件 这也是一种常见错误,不厌其烦地将目录下文件全数列出。例如: Disallow: /AL/Alabama.html Disallow: /AL/AR.html Disallow: →
基本搜索引擎优化策略
为什么有的网站能在搜索引擎上排名很好,而有的却连找到找不到呢?这个秘密何在呢?正如免费搜索引擎上的指导方针所说,有五个因素你是必须铭记于心的: 1、 你网站的内容与主题。 2、 每页的关键字数。 3、 关键字放置的位置。 4、 点击量。 5、 链接数量。 1、 搜索引擎优化策略:网站内容 网站的实际内容是你网络优化策略的一个重要的因素。如果你想你的网站能在搜索结果中排得靠前,在你的网站中必须有实际的内容。搜索引擎的蜘蛛基本上是一个瞎子。他们只能对你网页内容进行判断你网站的质量,而不能从图片、flash动画上判断。在所有的页面中有充足的内容给搜索引擎进行索引是一个成功搜索引擎优化策略的基本需要。很容易明白,为什么一个没什么内容的网站很难排上去。人们在查找信息的时候,总是希望找到一个包括很多重要信息的网站。很自然,网页内容丰富的网站要比那些网页内容还那么丰富的网站排名要好得多。每个为他们的网站进行优化的站主牢记。不要忘记更新你的网站。无论是搜索引擎还是访问者都希望看到比较新的信息。这是什么意思呢?这就要求你要收集大量的信息,专注于这领域的变化。 2、搜索引擎优化策略:关键字密度 网页上通常会有数以百计的词语,那么搜索引擎怎样去分辨哪些是描述你的网站的重要的词语呢?搜索引擎会统计你一个页面的字数。那些重复出现的词或短语被认为比较重要些。搜索引擎利用自身的算法来统计你页面中每个字的重要程度。关键字数与该页面字数的比例称为关键字密度,这是一个搜索引擎优化策略最重要的一个因素。 为了得到更好的排名,你的关键字必须在页面中出现若干次,或者在搜索引擎允许的范围内。 怎样才能知道关键字的密度是多少才能得到较好的排名呢?很简单,只要你在搜索引擎中搜索你要优化的关键字,然后统计一下排在前面几个网站该关键字的密度就可以了。当然也有很多统计关键字密度的工具(你可以在本站上找到)。 3、 索引擎优化策略:突出关键字 在有价值的地方放置关键字,当你统计完你的页面需要多少个关键字后,接下来就是考虑把你的关键字放在网页的什么地方。突出关键字是吸引搜索引擎注意的一个最重要的因素。搜索引擎将会专注于你网页中某一部分的内容,处于这一关注部分的词语显得比其他部分的词语要重要得多。这就是所谓的“突出关键字”。 A: Title 和meta 标签:在上一节已经提到,title 标签是网页中最重要的标签。所以在title中放置关键字显得非常重要。有一些搜索引擎会额外的注意“描述”与“关键字”标签。 B: 标题(headings)
反向链接的类型
综观各类网站,其反向链接的类型不外乎以下几种: (1)站内链接:分为两种,一种是实际存在的,而另一种是虚拟存在的;一种是为浏览者设计的,而另一种是专为搜索引擎设计的。 (2)镜象站的链接:分为两种,一种是有国际域名的镜象站,而另一种是使用免费空间所做的“桥页。 (3)友情链接(交换链接)。 (4)自助链接。 (5)blog链接。 (6)wiki链接。 (7)guestbook链接。 (8)forum链接。 (9)网页目录。 (10)搜索引擎的搜索结果。 (11)引用日志。
什么叫关键字密度
关键字密度 (Keyword Density) 是指在一个页面中,关键字(keyword)或关键字段(keyphrase)占所有该页面中总的文字的比例,该指标对 搜索引擎的优化起到关键的作用。为自然提高在搜索引擎中的 排名位置,您网站中页面的关键字密度不能过高,也不要过低,一般在 1% 到 7% 较为合适。如果要达到 1% 的比例,那么您在平均100 个文字中最好包含 1 个关键字或关键字段,如果在 1000 个文字中仅仅只包含 1 个关键字或关键字段,那么关键字密度就被稀释了。记住,您千万别把所有的关键字或关键字段堆积在一起,要不搜索引擎将人为是一种恶意行为(Spam), 直接降低您网站的排名位置。
搜索引擎优化(SEO)专业术语
Link Popularity 网站的链接广泛度 在搜索引擎排名中的作用已得到广泛的认同和重视。实际上,即使你没有在GOOGLE上提交你的站点,但与其它网站作了链接,GOOGLE也可能收录你的网站。搜索引擎还可能完全依据你的链接广泛度决定你的网站排名。 Internal Links 内部链接 本网站内部网页之间的链接。 External Links外部链接: 本网站外部的链接,一般是指其他网站连到本网站的链接。 Backward Links或Incoming/Inbound Links反向/导入链接: 意义与“外部链接”接近,指其他网站连到本网站的链接。 Outgoing/Outbound Links导出链接: 指从本网站连到其他网站的链接。 PageRank (简称PR) PageRank是Google衡量网页重要性的工具,测量值范围为从1至10分别表示某网页的重要性。在Google工具栏可以随时获得某网页的PageRank值。 Search Engine Optimization (简称SEO) 搜索引擎优化: Search Engine Positioning 搜索引擎定位: Search Engine Ranking 搜索引擎排名: External files外部文件存储: 把javascript文件和css文件分别放在js和css外部文件中。这样做的好处是把重要的页面内容放到页面顶部,同时能缩小文件大小。有利于搜索引擎快速准确地抓取页面重要内容。 Keyword Density 关键词密度: ROBOTS 搜索机器人: Affiliate Marketing 联属网络营销(有的称会员制营销、网站联盟等): 联属网络营销 指的是一种网站A为网站B放置广告按钮,然后从为网站B带来的销售额中获得回佣的一种广告系统。某些广告主通过这种方式获得市场信息而不是现金销售。这种方式被营销费用比较紧张的新网站采用得比较普遍。 Cost-Per-Click (简称CPC)按点击数付费: 联属网络营销管理系统记录每个客人在联属会员网站上点击到商家网站的文字的或者图片的链接(或者Email链接)次数,商家(Merchant)按每个点击多少钱的方式支付广告费。 Cost-Per-Lead (简称CPL)或Cost-Per-Acquisition (简称CPA)按引导数付费或: 访问者通过联属会员的链接进入商家网站后,如果填写并提交了某个表单,管理系统就会产生一个对应给这个联属会员的引导(Lead)记录,商家按引导记录数给会员付费。 Cost-Per-Sale (简称CPS) 按销售额付费: 商家只在联属会员的链接介绍的客人在商家网站上产生了实际的购买行为后(大多数是在线支付)才给联属会员付费,一般是设定一个佣金比例(销售额的10%到50%不等)。 Pay For Performance (按效果付费): 联属营销按效果付费的营销方式无论对于商家还是联属会员都是比较容易接受的。由于网站的自动化流程越来越完善,在线支付系统也越来越成熟,越来越多的联属网络营销系统采用按销售额付费的方法。由于这种方法对商家来说是一种零风险的广告分销方式,商家也愿意设定比较高的佣金比例,这样就使得这种方式的营销系统被越来越多地采用。 Open Directory Project (简称ODP) 目录索引: Full Text Search Engine 全文搜索引擎: Search Index/Directory 目录索引类搜索引擎: META Search Engine 元搜索引擎: Spider 俗称“蜘蛛”: Indexer 检索程序: Free →