周日. 8月 1st, 2021

本站上线不足两个月,在谷歌、百度、Bing、搜狗四个平台都注册了站长账户,关注各大搜索引擎的抓取和收录情况。堡主就此分析一下这几个站长平台的使用体验和优缺点。

一、索引量查询

站点中有多少页面可以作为搜索候选结果,就是一个网站的索引量。 具体是指被纳入索引库的收录的页面,才有可能排序展现,且排序展现的概率不一。

以上四个站长平台都提供索引量的查询。

从索引量来看,谷歌自然是速度最快且索引量最高的;百度的索引量更新周期较长,基本上要一周以上会提高一次索引量;必应更新周期短,但是对新站考核依然很谨慎,索引量增长的十分缓慢;搜狗站长我一直没有提交过url,全靠搜狗自己去抓取,大概在站点上线一个月后,从4月20日开始收录量和索引量突飞猛进,也许是过了新站考察期。

谷歌站长控制台索引
谷歌索引
百度站长索引
百度索引
bing站长索引
必应索引
搜狗收录、索引

二、站点地图抓取

站点地图(Sitemap),即网站上各网页的列表:
1)有助于搜索引擎发现并了解网站上所有网页
2)可以使用Sitemap提供网站的相关信息,如更新日期、更新频率等

谷歌站长控制台允许提交sitemap,且可以是索引型sitemap,非常友好,图中是提交了本站的索引型sitemap,谷歌提取出来的子地图。

Google search console 站点地图提交

百度站长允许提交站点地图(SiteMap),但是不允许提交索引型sitemap,一般提交之后就会开始第一次抓取,状态显示正常,且提取url数量不为0。堡主的站点基本上是每日更新一篇文章,sitemap抓取频率也很聪明的固定为每天一次。

百度站长平台站点地图提交

Bing站长平台与百度类似,提交索引型sitemap不予识别,

必应站点地图提交

搜狗站长平台只允许手动提交url,不支持sitemap形式的文件提交。今天又仔细看了一下帮助文档,发现搜狗的“sitemap采用邀请制,当您的网站存在原创或不可替代内容或不能被搜狗spider正确抓取时,才会开通sitemap权限”

搜狗站长平台sitemap规则

三、抓取频次查看

谷歌和必应站长工具都不提供抓取频次的数据。

堡主从百度统计发现了谷歌的爬虫会每天爬几个主要的页面,大概每隔四五天会大规模爬一遍整站。蜘蛛的ip段是72.14.199.xx,74.125.150.xx,查看来源都是美国谷歌云。必应的蜘蛛暂时没发现,可能抓取频次比较低。

百度站长平台提供抓取频次和抓取时间的天级数据,下面两张图就是本站的抓取情况,基本上维持在每天20的频次,时间1000毫秒。

百度蜘蛛抓取频次变化图
百度蜘蛛抓取时间变化图

搜狗站长平台提供30天内的网站抓取情况,见下图。搜狗蜘蛛的抓取还是很迷,在4月21日突然抓取50个页面,之后又恢复原样,每天装模作样抓一点点。

搜狗站长平台抓取情况

另外,每个站长平台都有点击量、关键词统计,站长可以根据关键词效果调整关键词布局,优化站点。

使用站长平台是为了更快的提交网站和收录,堡主还嵌入了百度统计代码,帮助统计站点的浏览量、访客量等等,更好的把控站点流量的变化和访客的兴趣点。

最后不得不吐槽一下360站长平台,第一次站点提交居然给我拒绝了。难怪360搜出来的都尽是些垃圾信息。


5月23日更新

上周堡主发现今日头条也在做搜索,就赶紧注册了头条搜索的站长平台,没想到在未提交任何网站之前,头条已经收录了本站的部分页面。提交了sitemap之后,索引量也在逐渐提升。与百度不同,头条可以提交站点属性设置,包括站点Logo,对个人站点还是很友好的。堡主提交了一次但是没有通过审核。

头条站长平台站点属性提交

另外,前一阵子在百度统计偶然发现了来自神马搜索的流量,堡主这才想起来注册神马站长平台,毕竟苍蝇再小也是肉。不过神马处理站点地图的速度实在是不敢恭维,下图是已经提交了4天截取的,依然没有处理。

神马站长平台sitemap提交

神马给摸鱼堡的评级是2级,暂时还没有结构化数据的提交权限(要求评级达到3才可以申请)。

神马结构化数据权限
   
 摸鱼堡版权所有丨如未注明,均为原创丨本网站采用BY-NC-SA协议进行授权
转载请注明转自:http://moyubao.net/anything/1898/

发表评论

邮箱地址不会被公开。