天涯论坛

 找回密码
 立即注册
搜索
查看: 147|回复: 4

白杨SEO:百度网站抓取反常的原由有哪些?有什么影响和处理办法?

[复制链接]

3139

主题

3万

回帖

9996万

积分

论坛元老

Rank: 8Rank: 8

积分
99968622
发表于 2024-7-4 00:15:30 | 显示全部楼层 |阅读模式

点击公众号关注,每周学习seo精细营销实战干货

作者:白杨SEO 全文2641字  预计阅3分钟

前言:这是白杨SEO公众号原创第220篇。经常有伴侣在我的SEO付费交流群暗里说,网站收录怎么又下降了,百度好似抓取出问题了,原由是什么怎么办,因此今天就来分享下哈。

大纲如下:

1、抓取反常是什么?百度抓取反常又是什么?

2、百度抓取反常原由那些3、网站抓取反常原由那些4、百度抓取反常对网站有什么影响?5、网站显现抓取反常处理办法

抓取反常是什么?百度抓取反常又是什么?

所说抓取反常便是指搜索引擎蜘蛛法抓取网站页面,网站显现的抓取反常便是抓取反常详细原由是什么下面会讲到。百度抓取反常是什么?简单理解便是百度的蜘蛛(baiduspider)法正常抓取,便是百度抓取反常。如上图,源自网上。9月3号,百度蜘蛛来抓取时,抓取时连接超时2次。百度抓取反常原由那些百度抓取反常的原原由重点分两大类,一是网站反常,二是链接反常。在哪里看呢,在百度搜索资源平台(https://ziyuan.baidu.com)你添加后数据统计—抓取反常那里,如下图。网站反常原由

1、dns反常

当百度蜘蛛(Baiduspider)法解析您网站的IP时,会显现DNS反常。可能是您的网站IP位置错误域名服务商把Baiduspider封禁了

能够用WHOIShost查找自己网站IP位置是不是正确况且能够解析,倘若不正确或法解析,与域名注册商联系,更新网站IP位置

2、连接超时

抓取请求连接超时,可能原由是:服务器过载网络不稳定。

3、抓取超时

抓取请求连接创立后,下载页面速度过慢引起超时。可能原由服务器过载,带宽不足

4、连接错误

法连接连接创立后对方服务器拒绝。

链接反常原由

1、拜访被拒绝

爬虫发起抓取,httpcode返回码是403。

2、找不到页面

爬虫发起抓取,httpcode返回码是404。

3、服务器错误

爬虫发起抓取,httpcode返回码是5XX

4、其他错误

爬虫发起抓取,httpcode返回码是4XX,不包含403和404。

关于上面说到的403、404、4XX、5XX等,其实都是网站HTTP状态码,倘若不清楚朋友能够看这一篇:白杨SEO:SEO入门学习之搜索引擎(百度)蜘蛛与网站HTTP状态码,再学习一下。

网站抓取反常原由那些网站抓取反常原由重点有以下五个方面:1、服务器反常服务器连接反常最大的可能是网站服务器过大,超负荷运转,经过检测浏览器输入你的域名是不是正常拜访。服务器反常引起蜘蛛法连接网站服务器,引起显现抓取失败。2、域名过期域名过期网站肯定不可拜访,域名解析就会失效了。倘若存在这类状况,你能够与你域名注册商联系处理,看是不是被抢注,还是能够续费回来。3、网络运营商反常电信和联通这两种都是属于网络运营商,蜘蛛拜访的网站。倘若由于电信或联通网络运营商显现问题,与网络服务运营商联系购买CDN服务。3、robots.txt文件设置问题robots.txt的功效重点有些要紧的文件屏蔽掉告诉搜索引擎这些些页面能够不抓取,但可能会存在把要紧的页面给屏蔽了,能够检测下robots文件设置。关于ROBOTS.TXT,能够看我之前写的这篇里面有写到:白杨SEO:新人学习SEO常遇到的15个SEO术语,意见保藏4、死链接原因本来正常的链接后来失效了便是死链接,死链接发送请求时,服务器返回404错误页面。死链的处理方法能够经过百度站长平台提交死链文件。5、网站被挂马网站被挂马,要查找挂马文件在哪里并删除。恢复网站,更改登录名和暗码,安全密保要从新设置,防止下次被挂马。倘若找不到,意见直接更换全部建站程序,换一个程序。百度抓取反常对网站有什么影响?倘若网站上存在海量内容蜘蛛法正常抓取,百度搜索引擎会认为网站给用户的体验上有缺陷(拜访网站的用户得到想要的东西,用户的体验感就会下降)降低对网站的评估况且,网站在抓取、索引、权重上都会受到必定程度的消极影响,更严重的会直接影响到网站从百度获取的流量。因此,百度网站抓取反常是非常严重的,一旦发掘尽可能处理怎样处理呢,继续往下看。网站显现抓取反常处理办法1、显现5XX类型错误状况

显现这些状况,并不是网站本身向搜索引擎说自己5XX问题,有时打开还是正常的,那样站长后台的为何表示这个错误呢?

倘若显现此类问题百分百是由于你的网站服务器导致,而针对某一个状态码的含义,例如503,直接交给技术来进行处理倘若技术还是处理不了,那样意见更换一家服务器。2、抓取显现DNS错误状况非常多SEO新人发掘网站打不开了就会马上找网站服务商,然则吧,域名DNS服务器有可能显现问题。当网站显现问题后,例如打不开,第1时间应当确定到底是什么问题?倘若是域名的DNS问题,那样白杨SEO意见更换DSN。由于有些DSN显现了这个问题,它后面还有可能显现倘若要换,就要换大一点的DNS服务商,例如阿里云收购的万网就不错,毕竟大机构,稳定性还能够的。3、显现抓取超时问题此刻做SEO排名已然到了用户为王时代,用户倘若不可第1时间打开你网站的页面,那样就会跳到其他网站上去。而搜索引擎蜘蛛呢,同样的。倘若第1时间抓取,就会显现抓取超时问题。上面说过,这个抓取超时,大多都是由于带宽不足,是网站页面太大而诱发因此处理办法意见如下:(1)、在不影响照片质量的状况下,对大的照片进行压缩哈;(2)、减少例如网站的JS脚本文件类型的运用有些JS进行合并;跟技术说清楚。(3)、全部网站页面长度进行掌控,尤其是你的网站首页。非常多人网站首页做了十来屏,通常用户最多下拉三到五屏。越长,全部加载就会越久。(4)、网页的内链数量,通常一个页面互相之间的内链数量意见不要超过500条哦,其实越多,蜘蛛都会去往下爬取,小网站基本没这个问题。

总之,百度抓取网站反常这个问题,意见建站时找成熟的程序建站,同期,找像阿里云这般的大的服务商。不要总想着省钱,淘宝随便几百建个站,找个不知名服务商,其实这般得不尝失的。

这篇比较简单,其实做SEO,官方的站长后台功能必定熟悉运用。你不懂技术能够,但必定晓得原理。否则,出问题,你都不晓得找谁。关于更加多能够关联举荐文案

关联举荐白杨SEO:一文告诉你阿里云的优良选取、配置、优惠及建站流程白杨SEO:机构公司网站建设制作流程是什么及建站重视事项!北风:最全wordpress建站攻略,代码基本的你能搞定!大仙SEO:怎样处理网站首页百度收录后被删除?白杨SEO:大白话告诉你理解搜索引擎工作原理的道理和运用白杨SEO简介:白杨SEO,专注SEO科研十年,SEO实战派。个人微Xbaiyang2047 对互联网精细引流有深入科研。前杰恩西运营总监(COO),现自由职业。白杨SEO付费群199元/年。如需加好友,验证:公众号;如需进群,验证:进群。倘若想加入白杨SEO付费星球学习提问,回复重要词“优惠券”就可,数量有限!




上一篇:码迷SEO独家内参(二)百度蜘蛛类型及蜘蛛抓取规律揭秘
下一篇:新网站多久会被百度收录?揭秘网站快速收录
回复

使用道具 举报

0

主题

1万

回帖

1

积分

新手上路

Rank: 1

积分
1
发表于 2024-8-25 13:23:01 | 显示全部楼层
我深受你的启发,你的话语是我前进的动力。
回复

使用道具 举报

0

主题

1万

回帖

1

积分

新手上路

Rank: 1

积分
1
发表于 2024-9-8 06:38:48 | 显示全部楼层
感谢你的精彩评论,带给我新的思考角度。
回复

使用道具 举报

3051

主题

3万

回帖

9910万

积分

论坛元老

Rank: 8Rank: 8

积分
99109030
发表于 2024-10-13 21:54:27 | 显示全部楼层
在遇到你之前,我对人世间是否有真正的圣人是怀疑的。
回复

使用道具 举报

2988

主题

3万

回帖

9956万

积分

论坛元老

Rank: 8Rank: 8

积分
99569163
发表于 2024-10-23 20:38:47 | 显示全部楼层
你的见解真是独到,让我受益匪浅。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|天涯论坛 ( 非经营性网站 )|网站地图

GMT+8, 2024-11-23 18:40 , Processed in 0.138745 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.