天涯论坛

 找回密码
 立即注册
搜索
查看: 63|回复: 1

只抓取网站首页,不收录内页,搜索引擎收录少的处理

[复制链接]

3138

主题

3万

回帖

9996万

积分

论坛元老

Rank: 8Rank: 8

积分
99968624
发表于 2024-7-9 19:10:45 | 显示全部楼层 |阅读模式

网站从上线到此刻一月了,然则百度和360收录始终仅有首页,谷歌收录有50,内页就始终很奇怪,之前始终以为是关键词优化问题,想着才上线跟新估计是这般的。然则后来发掘其他比我上线晚优化通常的网站收录虽然不多,然则会有内页。在百度历史收录记录里面发掘有以前的内页记录,然则是用的第1个默认模版的时候。因此我在想是不是内页屏B了我所有的收录界面,结果一查果然如此。

处理网站只收录首页,内页收录很少的办法有几种办法

1、检测网站的robots.txt文件的设置:

robots是站点与spider沟通的要紧途径,站点经过robots文件声明该网站中不想被搜索引擎收录的部分指定搜索引擎只收录特定的部分。请重视,仅当您的网站包括期盼被搜索引擎收录的内容时,才必须运用robots.txt文件。倘若期盼搜索引擎收录网站上所有内容,请勿创立robots.txt文件。为了避免站长在设置robots文件时显现,百度站长平台尤其推出了robots工具百度robots工具帮忙站长正确设置robots。

这个东西通常在网站的根目录下面,倘若你和我同样日前运用的网上套用的模版,大部分不会有这个文件(由于不会自己给你安装到你根目录下),倘若发掘有不懂的话能够直接干掉。

百度只收录首页不收录内页处理办法

2、检测文件中head部分的声明标签:

3、下面来仔细介绍下这个<meta name="robots" content="">申明的内容:

content中的值决定准许抓取的类型,必要同期包括两个值:

是不是准许索引(index)和链接(follow,能够理解为是不是准许沿着网页中的超级链接继续抓取)。共有4个参数可选,构成4个组合:

最后,意见大众不要太刻意的在robots.txt中设置太多禁止文件或目录,只设置确实不期盼被搜索引擎索引的目录和文件就能够了。倘若你碰到的问题和我同样那样能够检测下你的网站目录是不是有这个文件,申明呢?然则意见不要轻易禁止抓取,毕竟咱们必须的是流量。

还有一种状况便是网站还在考核期,因此大众保持原创,保持外链

http://www.suiningrc.com/

http://www.sncaipin.com/





上一篇:seo 蜘蛛只爬取首页?
下一篇:一个新站为么百度不收录,蜘蛛只抓取首页?
回复

使用道具 举报

22

主题

876

回帖

898

积分

高级会员

Rank: 4

积分
898
发表于 2024-8-30 15:35:18 | 显示全部楼层
“板凳”(第三个回帖的人)‌
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|天涯论坛 ( 非经营性网站 )|网站地图

GMT+8, 2024-11-23 05:36 , Processed in 0.111574 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.