返回顶部
首页 > 资讯 > 精选 >禁止搜索引擎收录网站内容的方法有哪些
  • 841
分享到

禁止搜索引擎收录网站内容的方法有哪些

2023-06-10 11:06:45 841人浏览 安东尼
摘要

这篇文章主要讲解了“禁止搜索引擎收录网站内容的方法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“禁止搜索引擎收录网站内容的方法有哪些”吧!第一种、robots.txt方法搜索引擎默认的

这篇文章主要讲解了“禁止搜索引擎收录网站内容的方法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“禁止搜索引擎收录网站内容的方法有哪些”吧!

第一种、robots.txt方法

搜索引擎默认的遵守robots.txt协议,创建robots.txt文本文件放至网站根目录下,编辑代码如下:

User-agent: *
Disallow: /

通过以上代码,即可告诉搜索引擎不要抓取采取收录本网站,注意慎用如上代码:这将禁止所有搜索引擎访问网站的任何部分。

如何只禁止百度搜索引擎收录抓取网页

编辑robots.txt文件,设计标记为:

User-agent: Baiduspider
Disallow: /

以上robots文件将实现禁止所有来自百度的抓取。

这里说一下百度的user-agent,Baiduspider的user-agent是什么?
百度各个产品使用不同的user-agent:
产品名称 对应user-agent
无线搜索 Baiduspider
图片搜索 Baiduspider-image
视频搜索 Baiduspider-video
新闻搜索 Baiduspider-news
百度搜藏 Baiduspider-favo
百度联盟 Baiduspider-cpro
商务搜索 Baiduspider-ads
网页以及其他搜索 Baiduspider

你可以根据各产品不同的user-agent设置不同的抓取规则,以下robots实现禁止所有来自百度的抓取但允许图片搜索抓取/image/目录:
User-agent: Baiduspider
Disallow: /

User-agent: Baiduspider-image
Allow: /image/

请注意:Baiduspider-cpro和Baiduspider-ads抓取的网页并不会建入索引,只是执行与客户约定的操作,所以不遵守robots协议,这个就需要和百度的人联系才能解决了。

如何只禁止Google搜索引擎收录抓取网页,方法如下:

编辑robots.txt文件,设计标记为:

User-agent: googlebot
Disallow: /

编辑robots.txt文件

搜索引擎默认的遵守robots.txt协议

robots.txt文件放在网站根目录下。

举例来说,当搜索引擎访问一个网站时,首先会检查该网站根目录中是否存在robots.txt这个文件,如果搜索引擎找到这个文件,它就会根据这个文件里的内容,来确定它抓取的权限的范围。

User-agent:
该项的值用于描述搜索引擎robot的名字,在”robots.txt”文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在”robots.txt”文件中,”User-agent:*”这样的记录只能有一条。

Disallow:
该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robot访问到。例如”Disallow:/help”对/help.html 和/help/index.html都不允许搜索引擎访问,而”Disallow:/help/”则允许robot访问/help.html,而不能访问/help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在”/robots.txt”文件中,至少要有一条Disallow记录。如果”/robots.txt”是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。

下面举几个robots.txt用法的例子:

User-agent: *
Disallow: /

禁止所有搜索引擎访问网站的所有部分

User-agent: Baiduspider
Disallow: /

禁止百度收录全站
User-agent: Googlebot
Disallow: /

禁止Google收录全站

User-agent: Googlebot
Disallow:
User-agent: *
Disallow: /
禁止除Google外的一切搜索引擎收录全站
User-agent: Baiduspider
Disallow:
User-agent: *
Disallow: /
禁止除百度外的一切搜索引擎收录全站

User-agent: *
Disallow: /CSS/
Disallow: /admin/
禁止所有搜索引擎访问某个目录
(例如禁止根目录下的admin和css)

第二种、网页代码方法

在网站首页代码<head>与</head>之间,加入<meta name="robots" content="noarcHive">代码,此标记禁止搜索引擎抓取网站并显示网页快照。
在网站首页代码<head>与</head>之间,加入<meta name="Baiduspider" content="noarchive">即可禁止百度搜索引擎抓取网站并显示网页快照。
在网站首页代码<head>与</head>之间,加入<meta name="googlebot" content="noarchive">即可禁止谷歌搜索引擎抓取网站并显示网页快照。

另外当我们的需求很怪异的时候,比如下面这几种情况:

网站已经加了robots.txt,还能在百度搜索出来?

因为搜索引擎索引数据库的更新需要时间。虽然Baiduspider已经停止访问您网站上的网页,但百度搜索引擎数据库中已经建立的网页索引信息,可能需要数月时间才会清除。另外也请检查您的robots配置是否正确。如果您的拒绝被收录需求非常急迫,也可以通过投诉平台反馈请求处理。

希望网站内容被百度索引但不被保存快照,我该怎么做?

Baiduspider遵守互联网meta robots协议。您可以利用网页meta的设置,使百度显示只对该网页建索引,但并不在搜索结果中显示该网页的快照。和robots的更新一样,因为搜索引擎索引数据库的更新需要时间,所以虽然您已经在网页中通过meta禁止了百度在搜索结果中显示该网页的快照,但百度搜索引擎数据库中如果已经建立了网页索引信息,可能需要二至四周才会在线上生效。

希望被百度索引,但是不保存网站快照,如下代码解决:

<meta name="Baiduspider" content="noarchive">
如果要禁止所有的搜索引擎保存你网页的快照,那么代码就是下面的:
<meta name="robots" content="noarchive">

常用的一些代码组合:

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接

感谢各位的阅读,以上就是“禁止搜索引擎收录网站内容的方法有哪些”的内容了,经过本文的学习后,相信大家对禁止搜索引擎收录网站内容的方法有哪些这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

--结束END--

本文标题: 禁止搜索引擎收录网站内容的方法有哪些

本文链接: https://lsjlt.com/news/260407.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 禁止搜索引擎收录网站内容的方法有哪些
    这篇文章主要讲解了“禁止搜索引擎收录网站内容的方法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“禁止搜索引擎收录网站内容的方法有哪些”吧!第一种、robots.txt方法搜索引擎默认的...
    99+
    2023-06-10
  • 如何禁止网站内容被搜索引擎收录的几种方法讲解
    通常做网站的目标就是让搜索引擎收录,扩大推广面,但是如果你的网站涉及个人隐私或者机密性非公开的网页而需要禁止搜索引擎收录抓取的话,该如何操作呢?比如淘宝网就是禁止搜索引擎收录的一个例子,本文将教你几种做法来实现屏蔽或禁止...
    99+
    2022-06-04
    禁止搜索引擎收录网站内容 如何禁止网站内容被搜索引擎收录的几种方法讲解
  • 新站总是不被搜索引擎收录的原因有哪些
    小编给大家分享一下新站总是不被搜索引擎收录的原因有哪些,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!使用了被惩罚过的域名许多人为了贪图方便省时间就很喜欢用老域名,当然我们也知道的是老域名在网站排名当中也是占有一定的优势,如...
    99+
    2023-06-09
  • 搜索引擎图片搜索收录展现基本要求有哪些
    这篇文章主要为大家展示了“搜索引擎图片搜索收录展现基本要求有哪些”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“搜索引擎图片搜索收录展现基本要求有哪些”这篇文章吧。  对于图片搜索,细心的网友很早...
    99+
    2023-06-09
  • 企业网站不利于搜索引擎优化的方法有哪些
    这篇文章将为大家详细讲解有关企业网站不利于搜索引擎优化的方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。  一、网站更新文章加入大量图片,而且图片没有做过处理  现在网速和以往比较已经不是同日而语...
    99+
    2023-06-10
  • 网站开发中搜索引擎收录少的解决方法是什么
    本篇文章给大家分享的是有关网站开发中搜索引擎收录少的解决方法是什么,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。一个网站的搜索引擎收录量的高低,确实可以反应出网站现存在的一些不...
    99+
    2023-06-12
  • 如何解决网站搜索引擎不收录的问题
    本篇内容主要讲解“如何解决网站搜索引擎不收录的问题”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何解决网站搜索引擎不收录的问题”吧!一、更新维护信息的重要性更新维护信息的重要性:平时要注意平台...
    99+
    2023-06-10
  • 网站搜索引擎降权的处理方法
    这期内容当中小编将会给大家带来有关网站搜索引擎降权的处理方法,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。网站降权目前是很多从事网站运营工作者比较关心的话题,有时可能是因为某种疏忽而导致被搜索引擎降权,也...
    99+
    2023-06-12
  • 在不同的搜索引擎中更好的优化网站的方法有哪些
    这篇文章主要介绍“在不同的搜索引擎中更好的优化网站的方法有哪些”,在日常操作中,相信很多人在在不同的搜索引擎中更好的优化网站的方法有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”在不同的搜索引擎中更好的优...
    99+
    2023-06-10
  • 百度和Google搜索引擎收录网站的区别是什么
    这篇文章给大家介绍百度和Google搜索引擎收录网站的区别是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。根据搜索引擎当前的发展情况比较和分析一下百度和Google这两大搜索引擎在收录网站方面的区别。  首页规则 ...
    99+
    2023-06-13
  • 让网站内容被秒收的方法有哪些
    这篇文章主要介绍“让网站内容被秒收的方法有哪些”,在日常操作中,相信很多人在让网站内容被秒收的方法有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”让网站内容被秒收的方法有哪些”的疑惑有所帮助!接下来,请跟...
    99+
    2023-06-10
  • 网站开发中搜索引擎算法调整和被搜索引擎惩罚的解决方法
    这期内容当中小编将会给大家带来有关网站开发中搜索引擎算法调整和被搜索引擎惩罚的解决方法,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。Google被惩罚,百度算法频繁更新。2009年金融危机,对我们这些依赖...
    99+
    2023-06-12
  • 企业网站在搜索引擎中排名差的原因有哪些
    这篇文章将为大家详细讲解有关企业网站在搜索引擎中排名差的原因有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。  一、企业网站站内相关性太弱  虽然你的网站都是原创,但是不少的人所更新的内容和首页的主体...
    99+
    2023-06-10
  • 搜索引擎优化SEO常用分析方法有哪些
    这篇文章将为大家详细讲解有关搜索引擎优化SEO常用分析方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。如何分析竞争对手网站外部因素分析:雅虎查反向链接数量。百度谷歌查询收录量。查询域名使用时间.内...
    99+
    2023-06-10
  • 促进网站和博客排名的搜索引擎优化SEO技术有哪些
    这篇文章主要介绍“促进网站和博客排名的搜索引擎优化SEO技术有哪些”,在日常操作中,相信很多人在促进网站和博客排名的搜索引擎优化SEO技术有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”促进网站和博客排名...
    99+
    2023-06-10
  • 建站之初提高网站收录率的方法有哪些
    本篇内容介绍了“建站之初提高网站收录率的方法有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!  设置好网站的robots文件  robo...
    99+
    2023-06-10
  • 网站开发中网站不收录的解决办法有哪些
    这期内容当中小编将会给大家带来有关网站开发中网站不收录的解决办法有哪些,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。现在有很多的人都在问我网站不收录是什么情况,其实这要看你的网站是新站还是老网站,除此之外...
    99+
    2023-06-07
  • 百度删除网站收录内容的解决方法是什么
    这篇文章给大家介绍百度删除网站收录内容的解决方法是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。网友问:为什么百度收录了我的内容页,过后又删除   落拓的回复:   网站权重问题、文章原创度不够!   百度首次索引...
    99+
    2023-06-12
  • 内页快速收录并有排名的方法有哪些
    这篇文章主要介绍“内页快速收录并有排名的方法有哪些”,在日常操作中,相信很多人在内页快速收录并有排名的方法有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”内页快速收录并有排名的方法有哪些”的疑惑有所帮助!...
    99+
    2023-06-13
  • 网站获取流量的引流方法有哪些
    这篇文章主要介绍了网站获取流量的引流方法有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。  网站流量对于做网站优化是至关重要的,除了网站本身的基础优化要做好之外,前期做网...
    99+
    2023-06-10
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作