泥胚文章写作网,原创文章写作中心,文章阅读,成就网上文章写作梦想 泥胚文章写作欢迎       设为首页

泥胚文章写作网 | 搜索引擎

搜索引擎对原创文章的识别及应对策略

三秒钟免费注册

文章作者: 泥人    加为好友   发送站内短信    日期: 2008-01-30 14:14:43    点击: 1512
更多相关文章:搜索引擎 原创文章    文章系统标签:搜索引擎 原创 文章 原创文章 发表 识别 

    站长们时常会问起搜索引擎对原创文章的识别能力问题,也有很多站长抱怨,我辛辛苦苦写的原创文章,被别人一转载,搜索引擎上就找不到我自己的文章了,转载的反而成了原创,而原创的反而成了盗版。

    搜索引擎是否具有识别原创文章的能力?如果有的话,又是基于什么原理呢?

    原创文章被搜索引擎的识别目前主要还是基于文章被搜苏引擎的索引时间(收录时间)以及文章的链接两个因素。越早被搜索引擎收录的越有可能被搜索引擎认为是原创,这个看起来合理,事实上也不一定,因为最早发表在网上的也不一定是发表者原创,只能说是最早发表。因此本文讲的原创都只能是最早发表的含义,而不考虑最早发表的本来就不是原创的情况。

    另外,如果文章中包含了出处,转载者同时也保留了出处,那么这些文章的链接将会呈现出星形状态,所有转载的文章都将出处指向了真正的出处,搜索引擎就可以根据这个链接判断文章的出处。

    上面的分析也只能是理论上的分析,搜索引擎的排名规则也并不是只有是否为原创一条规则,它还会考虑网站影响力,相关性等等因素,然而如果说搜索引擎将非原创的文章呈现在结果里,而将原创文章不显示出来,对原创者来说就显得极为不公平。

    泥人经过试验观察,发现google的原创文章的识别能力要远强于百度。以两个例子来说明。

    泥人几乎是同时在自己的网站泥胚文章写作(www.nipei.com)和admin5发表了一篇文章《关键字云雾在SEO中的应用》,两篇文章都被百度和google收录,后来两篇文章被一些网站引用,有的网站保留了文章的原始出处,而有的网站在转载时去掉了链接,一周内在百度和google里搜索“关键字云雾”,都找不到在本站的原始出处的文章,再过了几天,google将本站的原始出处的文章排到了首位,而在百度里,仍然找不到本站的文章。这个例子说明,时间基本相同的情况下,google仍然能根据文章的链接判定文章的原始出处,而百度做得就差了些。

    另一个例子是泥人的另外一篇文章被别人盗用在百度空间里,盗用者没有注明出处,盗用时间大概是原创文章发表后10天,结果可想而知,差不多两周后,原创文章从百度的搜索结果里消失了,取而代之的是那篇盗用文章。然而google依然将本站的原始文章排在首位。这个例子说明,google能根据发表日期来判定原创文章,而百度却依然不能。

    针对于以上观察结果,泥人认为站长可以采取以下对策。

    1、在原创文章末尾注明转载需要保留的文字、链接以及声明,一方面是提醒转载者要尊重他人的知识产权,转载时要保留出处,另外一方面,也是为转载者提供方便,因为,有时转载者不是不想加出处,只是怕麻烦。

    2、如果自己的事小站,PR不够高,建议将自己的原创文章发表在自己的小站上,过一周左右,再去向一些大站投稿,以保持文章被搜索引擎收录的一个时间差,便于搜索引擎判定文章原始出处。

    3、如果你的原创文章被盗用的文章给PK下去了,不妨在盗用者文章的评论里加上文章的原始出处,提醒转载者,也方便搜索引擎来判断原始出处。

    4、有可能的话,还是在文章的正文中加入一个自己网站的链接。

    最后,对于国内知识产权保护的现状,文章被盗用的现象还很严重,如果说文章被盗用还没有造成严重影响的话,建议站长还是保持一颗平常心,以平常心待之,毕竟比人愿意转载你的文章,说明是对你的文章的认可。不抛弃,不放弃,坚持做傻子。


作者:泥人,是泥胚网站长,硕士学历,青年管理学研究者,科技工作者,研究领域:企业管理、项目管理、管理信息化、财经产业等。欢迎交流。
文章来源:泥胚文章写作网 http://www.nipei.com   原文地址:http://www.nipei.com/article/1393
转载本文章必须保留作者、出处链接以及本声明。
转载不注明出处、程序采集是侵权行为,我们保留追究其一切责任的权利。

  通过QQ、MSN、Email发送下面的文章地址给朋友,向朋友推荐本文章
  

  • Currently 3.89/10
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  •   网友评分: 3.9/10 (共 9 票),请为本文评分


    文章留言

    [1楼] 评论人: 游客   评论时间:2008-02-17 21:35:32     
    我来说一下我自己的一些看法,搜索引擎判断原创的两个标准我就不用多说了,我想说的是,搜索引擎到底收录了哪些内容了?整个网页,也就是说,原创文章的文字字符是其中一部分,收录的还包含了该文章的页面的其他信息。为什么说搜索引擎排斥哪些重复复制的页面?那就是因为多个页面中包含了相同的页面html代码,比如相同的表格,相同的行数,相同的列数,相同的背景色等信息。那么,原创文章所在网页包含的html代码都该算在原创范围,不仅只是文字字符,当转载者连同这些代码一起复制走之后,转载文章的页面也同样包含了这些源码,按常理肯定的是原创文章所在的页面排名肯定比这个转载的页面要高。但是,当转载把网页html代码中的真正文字提炼出来后,再加以修改处理,比如修改头尾,修改标题,文章中字体采取加粗等操作,那么这时搜索引擎收录时,无法分辨出他是转载的了,也就是当作原创来处理,这就是伪原创文章,伪的不仅是文字,伪的还有文字以外的内容。这也是解释为什么很多原创文章没有一个好的排名的原因所在。作者:丁冉 我的网站:www.maamb.cn 欢迎交流!


    发表留言 雁过留声,人至留言  [自动过滤有外部链接及广告留言,敏感留言审核后显示,禁止发布非法内容]


    请输入校验码,不区分大小写游客需要验证码,注册后无需验证码

    Visual CAPTCHA


    阅读更多相关文章:

    IIS_rewrite伪静态设置方法     泥人
    雅虎收录问题的解决     泥人
    网站推广三十六招(1)     泥人
    搜索引擎对关键字堆砌的识别     泥人
    网站推广三十六招(2)     泥人
    SEO必须远离的手段     泥人
    搜索引擎对重复内容的识别及漏洞     泥人
    怎样优化网站,网站优化技术,网站搜索引擎优化,网站代码优化     CarRy
    智能搜索引擎WolframAlpha会改变世界吗?     泥人
    Wikia发布开源搜索引擎     泥人
    更多关于搜索引擎的文章
    更多关于原创文章的文章
    更多关于搜索引擎的文章
    更多关于原创的文章
    更多关于文章的文章
    更多关于原创文章的文章
    更多关于发表的文章
    更多关于识别的文章

    点击下面图标可将本文章加入您的网摘或网络收藏夹,方便下次阅读文章,也可与他人共同分享本文章。

    点击下面图标可将本文章推荐到掘客网站,与更多的人一起分享本文章。