双仓库解决站点不被百度收录问题

发现站点流量问题

注册了百度统计和谷歌分析的账号,网站的源码中大神嵌入了统计的代码,我的站点可以把用户的每一次浏览记录,并分析用户的行为,这样可以知道自己站点资源的优劣,并加以改进了。

也注册了谷歌搜索和百度搜索资源平台的账号,这样可以把站点内容推送给搜索引擎,以期获得更多的点展量。

最近发现网站的流量来源中,“百度”消失了。怎么回事呢?

查看百度资源搜索平台

确实点展量和收录都快消失了

百度抓取诊断

发现是403,也就是百度的爬取被git-pages服务器拒绝了,网上查了下,说是百度爬得太猛了,以至于影响了其它用户的使用,可以采用双仓库解决

coding(腾讯云开发平台)再部署

如同github上的部署,之后也在coding更改域名为 www.66xk.wang, 之后我的域名中添加重定向的解析记录,www.66xk.wang 重定向到腾讯云开发平台的pages服务域名,与定向到git-pages服务域名不同的是,这个解析记录专门针对百度,也就是百度来了,只能去腾讯云的pages,到不了git-pages,然后就让它爬呀,分析呀去得到 www.66xk.wang 后面的地址去收录,就不会被拒绝了。普通用户的访问还是重定向到git-pages服务的。

不使用码云的原因是它的自定义域名服务是收费的。

双仓库同步

这个就比较简单了,首先git clone github的仓库到本地,每次发布后,执行git pull ,更新本地仓库,再推送本地master到coding的仓库,就可以实现同步了。

回归正常


双仓库解决站点不被百度收录问题
https://blog.wangxk.cc/2019/09/09/双仓库解决站点不被百度收录问题/
作者
Mike
发布于
2019年9月9日
许可协议