回归黑帽seo科普系列。
你到源码站去搜,发掘一堆“泛XX”的代码,其中以“泛内页、泛目录”占多数,那这是个什么东西?
看各样程序的介绍,非常niubility的样子。但站在小白的视角看来,依旧搞不懂是什么东西。
正常的网站,一个URL都对应独一的关键词,例如我创立一个网站,设置2个url格式,一个列表页,一个详情页:
https://www.test1.com/{cid}/
https://www.test1.com/{cid}/{pid}.html
这个url结构,最少得创建两个数据表:
一个是cid--cname,存放“归类id和归类名叫作”的映射关系
一个是pid-cid,存放“某个文案和对应归类”的映射关系
cid是归类的id,pid是文案的id,每一个pid对应独一的title。哪个pid归属于哪个cid的映射关系,是写死在数据表里的。
只要你不改这个映射关系,每一个pid详情页对应的title,永远是不变的。
而泛内页,是无这个映射关系的。pid这个变量,你在浏览器随便写,都能正常拜访,title通常是随机匹配的。
举几个栗子:
1)url不变,每次刷新,模板和title都变。模板和title与pid之间无任何映射关系,随机匹配的。
2)但这般每次都变,对搜索引擎不友好。加上缓存,在一段时间内,让模板与title和pid绑定
如设置缓存86400秒,依旧url不变,N次刷新,模板和title不变
3)有些另类的url后缀是不可拜访的,如.txt,.pdf,.xlxs.....
同理,经过创建新的url路由,来实现正常拜访
4)任意url随机匹配关键词
同理,列表页这个cid,亦无映射关键词,url中的cid亦能够随便输入,都能正常拜访
简而言之,“泛XX”便是你随便输入url,都能正常拜访。页面上显现的链接,都是程序随机生成的,随机就寓意着无限大,baiduspider能发掘无限大的未爬取的url,这般就有可能带源自源持续的抓取。
至于怎么随机,看程序的设置,能够“有范围的”随机,例如url必须符合某个格式,或随机的id,必须是在某个列表内的才可拜访等
有时候卖程序亦会换个说法,叫“XX繁殖”,例如内页繁殖啥的,意思都差不多。
近期有小白看了有些程序的介绍,暗示内心很激动,其实大可不必,SEO行业内,大都数状况下,程序都是次要的,即便再怎么“泛XX”,只是处理内容量的问题,但处理不了收录。
从功能的实现来讲,不难,基本上工作1、2年的php,把规律告诉他,都能实现一个差不多的程序。
不说叻,开会去。
有啥想看的请留言,近期疫情影响,事情少了非常多,能多写点。
|