Googlebot 是 Google 网络爬虫的名称。
如果您想阻止 Googlebot 抓取您的网站,您可以将以下代码添加到 robots.txt 文件:
用户代理:Googlebot
不允许:/
此代码将告诉 Googlebot 不要抓取您网站上的任何页面。
然而,只有当您有特定原因想要阻止您的网站被 Google 编入索引时,您才应该使用此代码。
例如,如果您有一个不想被编入索引的暂存网站,则可以使用此代码来阻止 Googlebot 抓取它。
否则,您的网站可能会出现重复内容的问题。
阻止 Bing 爬虫 Bingbot
如果 多米尼加共和国手机号码数据 您想阻止 Bing 的机器人 Bingbot 抓取您的网站,您必须将以下代码添加到您的 robots.txt 文件中:
用户代理:Bingbot
不允许:/
阻止 Yahoo 爬虫程序 Slurp
如果您想阻止 Yahoo 的爬虫程序(称为 Slurp)抓取您的网站,您可以在 robots.txt 文件中使用以下代码:
用户代理:Slurp
不允许:/
您还可以使用相同的代码来阻止任何其他搜索引擎的爬虫,只需将“Slurp”替换为爬虫的名称即可。
值得注意的是,阻止搜索引擎的爬虫也会阻止您的网站出现在该搜索引擎的搜索结果中。
因此,只有当您有特定理由想要这样做时才应该使用它。
阻止 SEO 工具的蜘蛛和爬虫
SEO 专业人士经常使 诺曼爱尔兰 用常见的 SEO 工具(如 Semrush 和 Ahfres)来评估他们的竞争对手,这些工具使用机器人、爬虫和蜘蛛来获取这些信息。
这可能是您想要阻止属于 Ahrefs 或 Semrush 的蜘蛛和爬虫的主要原因,但还有其他原因让您想要阻止这些机器人抓取您的网站。例如,这些爬虫与谷歌的机器人并不完全相同。如果有人开始抓取您的网站,Semrush 或 Ahrefs 机器人可能会大大减慢您的页面速度,并且它们还会消耗大量带宽。
此外,一些机器人可能会在您的 GA(Google Analytics)上产生虚假流量,这可能会在尝试确定网站受欢迎程度时扭曲结果。
因此,许多 SEO 专业人士 达荷美铅矿 选择使用 robots.txt 来阻止他们用来评估竞争对手的常见机器人。这有助于确保他们能够准确评估其网站的流量并提高其在搜索引擎结果页面中排名靠前的机会。
Semrush
以下是您需要添加到 robots.txt 的代码行,以阻止 Semrush Crawler 访问您的网站。