对于有些站长来说,为了不让搜索引擎收录,会配置转载模式,也就是给文章添加属性。还有一种就是伪原创内容,说实话博客经常会转载,当然网站上也有不少伪原创,但是绝大多数都会被整理出来。所以目前百度等搜索引擎的收录速度还是不错的。那么如何才能让百度等搜索引擎收录转载或者伪原创模式呢?下面是我自己的一些看法。
相信大家都看到过,我们在A5、站长之家、推推网等大型站长论坛做外链的时候,有时候会看到自己发布的外链可以秒收录。这对大型网站来说是建立在信任的基础上的,而对于小型网站来说,别说转载或者伪原创内容了,就算是原创也未必会被收录。
同时我们都知道,一个网站如果转载过多,是不会被收录的,既然收录不了,自然也就得不到排名了,所以看到大家都在纠结这个问题,我就研究了一段时间,找到了核心的解决方案。
我们先来看一下我的网站总共有多少篇文章,一个网站的每一篇文章都是有一个页面对应的,至于一篇文章有多个页面的特殊情况,暂时不考虑。
我们看一下网站的索引数据,从上个月到这个月,索引量翻了一倍,3000多个页面,4000个索引量,已经非常不错了。
上图是爱站工具查询到的百度站点数据,站点数据显示收录了3154个网页,从下面的数据粗略计算,有80%的文章被收录,而且几乎是秒收录,我们是怎么做到的呢?
定期更新
不更新的话肯定不会被收录,所以不管是抄袭还是原创,都要有更新的新页面,这样搜索引擎才能收录。最好建议定期更新,比如论坛、BBS可能做不到定期更新,但至少也要在一个范围内,不可能一天发一万条帖子,今天一个帖子都没有。
对于小型网站来说,可以按时更新,自己设定一个时间,写完之后按时发布。
网站地图
站点地图不需要在页面模板顶部标上a标签,关键是将.xml地图写入.txt文件。
还有一种方式就是直接把地图提交到站长平台,你设置的更新时间根据你网站的更新时间而定,一般情况下我们网站都是配置为每天更新一次,所以你可以按照下图设置。
当然你也可以看看《提高网站收录,百度整理数据插件应用汇总》这篇文章,毕竟有时候我们如果使用插件的话,还是不如百度自家的产品的。
百度权威经常会有一些活动,部落现在已经取消了子站点。
200K 之前的内容
为什么主题模式要在整个页面200K之前呢?因为往往一个大型的网页非常大,文字很多,推荐模式也很多,而搜索引擎只能识别200K的内容,所以200K之后,搜索引擎就识别不了了。如果每个页面的模式都在200K以上,那么搜索引擎就根本看不到文章了,所以它最后看到的模式是每个页面一模一样的。当然,正常情况下一个网站相对来说200K以下比较好,我网站上一个1500字的页面也就80K而已。所以识别文章模式还是比较容易的。
至于这个形式,它根植于互联网,我相信它还是有启发性的。
流量攻击
我们团队花了一个月的时间推广九文网,IP大概在800左右,平均上首页的文章数量在800以上,如果一篇文章有100个点击量却没有被收录,对搜索引擎来说就是失败。比如这篇文章非常火爆,却没有被收录,用户就找不到,自然会去其他搜索引擎,所以这也是搜索引擎随机收录的标准之一。
及时性
我做的是一个自媒体平台web,所以内容每天都会更新,而且更新形式很及时,基本都是站长当日新闻的形式。为什么说及时呢?首先及时的内容是有搜索量的,但是模式不多,所以搜索引擎会关注撰写并发布这种内容的网站。其次及时的内容更容易满足用户的需求。
外部链接
这里需要指出的是,如果您的网站收录正常,建议先将文章收录好,再建立外链,尤其是那些大型网站或者BBS。
最后一个就是外部链接的处理,久闻网的互联网团队每天都会花2个多小时去批评各大博客,批评留下的链接基本都是内页,所以搜索引擎抓取,人家直接点击进入内页。可能有人会说,博客评论、留言里的链接大部分都是带标签的,搜索引擎是不会抓取的,其实比较复杂,只是不传递权重,并不妨碍抓取。不信的话,看下面我们网站的外部链接图片,它们都记录在外部链接数据里,能说不抓取吗?
概括
搜索引擎的收录和排名并不是由两个因素决定的,而是通过综合分析来确定一个网页的收录和排名。也就是我们所说的“权重”,也可以理解为幸福感。