网站301跳转后实时记录

经过半年的策划和开发,新的网站终于可以上线了,因为之前的网站有很大的局限性,首页是学校的招生信息,内置了一个高考频道,现在就是将高考频道里面的文章301跳转到上述新站中。

为了方便,我们将之前的网站称作a.com,新上线的站称作b.com,现在是将a网站的高考频道和问答频道单独拉出来组建成b网站,a网站其他内容信息包括首页并不跳转,继续保留。操作是这样的,将a网站数据复制到b网站下,然后将不需要跳转的数据再删除,而保留的数据获取和a网站的对应id利于后期301跳转。

因为六月份就要高考,本计划是年初上线的b网站一直拖拖拉拉到3月份还没有完善,最后只能将会员登录后的具体功能全部扔到上线后去解决,因为这些功能并不影响搜索引擎抓取的页面URL和页面代码。这个也是我一直强调的,网站要不别上线,上线了,就不要改来改去,(b网站正式上线前,我们一直用一个弃用的域名做测试)。
本计划3月31日上线的,可最后因为创宇云服务器IP段出了问题,当天就联系阿亮答应第二天上午将IP切换到211段,不能让网站刚上线半天就换IP吧,这样对搜索引擎更不友好了,所以只好推迟到4月1日上线。

4月1日下午,在别人都下班回家的时候,我和技术还在忙着做上线前的准备工作,晚上六点先将数据解析到b网站上,因为之前用了测试域名,影响上线的问题几乎都解决了,所以b网站正式上线后已经很完美了。接下来就是将a网站的对应数据进行301跳转。
跳转后,问题立马就出现了:

1、a网站个别不跳转的数据也跳转到b网站了,因为b网站已经删除对应的数据,所以上述对应页面跳转到b站后全部是404。

2、a网站高考频道的文章有两个URL规则,一个是放在gaokao目录下,一个是放在根目录下,本计划跳转到b网站后统一规则全部放在gaokao目录下,可最后根目录下的还是跳转到b网站的根目录,并没在id前面加上gaokao目录也能打开。

3、有一个目录挑错了位置。
最后,只好立马停止301跳转,将上述问题彻底解决后再启动301,然后开始各种验证,百度站长平台、360站长平台、百度统计、搭建百度站内搜索,向百度站长平台提交手机站的自主适配,等全部完事后已经是晚上11点,也就是在离开单位的时候,b网站首页百度已经收录了。
可出现一个问题,百度站长平台抓取测试检测的b网站页面抓取速度在50ms左右,但测试跳转的a网站页面抓取速度已经上到了300多,打开a网站跳转的文章,缓冲时间很不理想。

4月2日
上午起来就迫不及待site新站的收录,发现,首页已经没有了,而是出现了三个文章收录,360已经收录了100多。这一天感觉很难熬,不断去站长平台看数据报告(一直显示计算中)。但这一天通过百度统计总结出:
1、新站明显pv:ip的比例比a站上升了不少。
2、查看站长统计的系统环境,手机端>pc端的流量。
3、新站新发布的文章不收录,不管是原创不原创。
PS:a站权重7,每日ip4万左右,大部分数据跳转到b站后,流量几乎转移过来,并没有损失多少,可能因为是初期跳转,流量还没有下滑。

4月3日
1、获得一个完整天的百度统计(4月2日),发现流量并没有丢失,原a站的排名都在,点击都跳转到了b网站,可能因为跳转缓冲时间有点大,中间会损失部分ip,但因为新站pv的上升,2日总体pv将近9万。
2、百度收录5条,首页恢复收录,但百度搜索新站首页标题,显示的却是a站的。360收录2000多。

3、在百度站长平台的搜索关键词发现新站已经有部分搜索词[非a站数据跳转],这让我很是惊讶。意思是,百度搜索某些关键词,搜索结果展现的域名已经有b站的了,可你复制对应的URL百度搜索下却显示未收录,查看有搜索结果页中的快照,直接跳转到新站,说明百度就算是展现了新站URL但并没有保存快照。

4、今天对网站日志进行了分析,a站网站日志除了个别的404之外,剩余的大部分是301和200,301的都是那些跳转到新站的URL,200是没有跳转的以及a站js、css文件;但看b站的日志就有点意思了,404和200返回码尽然各占一半,这确实把我吓一跳,为什么那么多404,查看后才多少松了口气,原来都是新站的js和css文件,这些文件在新站中确实是能打开的,可百度抓取的时候为什么是404返回码,我的猜想是,百度在抓取a站的时候,301跳转到了b站页面,因为b站页面的css和js文件都是相对路径,而百度将他们替换成了a站的绝对路径了(因为页面入口是a站),至于真实原因及解决办法还在寻找中。

4月5日
1、site百度收录数据还是在5条左右,并且首页收录很不稳定,一会消失,一会又展现。站长平台的索引量是4。
2、但百度站长平台b站的搜索关键词中已经展现除了很多关键词,搜索这些关键词会发现已经展现的是b站url。
3、b站的百度站内搜索site已经能查看5000多条。

4、百度搜索某些关键词,a站和b站展现的很错乱,有的是a站的标题下面显示b站的URL,有的是b站的标题却显示的是a站的URL。
5、爱站查询新站的权重已经上升到了6,预计来访6000左右,下面展现的关键词都是搜索结果页都是新站URL。
6、通过上面可以得出,这个时候,已经处在错乱期,百度site和索引量并不准确,已经存在大量的关键词展现了新站URL,可索引量和site还是个位数。

7、网站世界排名已经进入13万。
8、360收录了7000多条,并且大部分关键词已经展现了新站标题和新站的URL,所以说在301跳转上,百度还是过于保守了。
9、搜狗已经没有进行更新,新站收录为0。
最近开始对新站大量更新文章,每日维持在50篇左右,大部分都是整合的文章,并不是原创。至今百度没有收录任何新的文章。

4月8日
新网站上线一周了,百度site收录和站长平台百度索引量一直是在5条左右,但搜索关键词展现的域名新站的越来越多,现在百分之五十的关键词展现的是b站的域名。b站每日流量维持在3-4万ip,而a站因为有部分数据没有301跳转到新站,依然有4000左右的ip。
除了百度和搜狗之外,360和神马搜索各种指数每天都在上涨。

4月25日
最近出门旅游及回老家,前后有半个月的时间,昨日刚到长春,说下最近半个月的变化,网站新发布的文章过几天会部分收录,但整体收录还是没有恢复,总收录数量200左右,可用百度站内搜索显示一万多条,另外,老网站90%的关键词搜索结果都变成了新网站的URL。

PS:by三木

发表评论

电子邮件地址不会被公开。 必填项已用*标注