typecho单页面屏蔽百度蜘蛛

作者:stoat 发布时间:2014-01-23 分类:闲扯

百度蜘蛛貌似挺多的,这个基于typecho做的博客这么多文章它不采,偏偏只采集國外收集的footprints列表这篇文章,去年买了个大手表的,一篇转文你采个屁啊,其余的又不收录,贱到程序里去了。typecho单页面屏蔽百度蜘蛛.jpg

typecho单页面屏蔽百度蜘蛛


在header.php相应部位添加以下代码:
<?php if($this -> is('post','56')){?>
<meta name="Baiduspider" content="noindex"> 
<meta name="baiduspider" content="noindex"> 
<?php }?>

知识扩展


1、只使用了元标签某个指定的网页不被搜索引擎收录。

<meta name="robots" content="noindex">              <!-- 阻止所有爬虫 -->
<meta name="googlerobot" content="noindex">         <!-- 阻止百度蜘蛛收录 -->

2、使用robots.txt防止收录单页面的办法:

User-agent: Baiduspider
Disallow:/56.html
User-agent: baiduspider
Disallow:/56.html

但是这个需求来用robots.txt显然小题大做了。

3、各大主流搜索引擎的User-Agent值


  • Google:googlebot
  • 百度:baiduspider
  • 雅虎:slurp
  • MSN:msnbot
  • Alexa:is_archiver

4、Typecho 判断页面:神器is()。

用法:

$this -> is('post','56')

参数:


  • index:第一个参数设为index,可以判断当前页是否为主页
  • archive:第一个参数设为archive,可以判断当前页是否为文章归档页,比主页,分类文章页,标签文章页,日期归档文章页
  • category:第一个参数设为category,可以判断当前页是否为分类文章页,第二个参数传入具体分类slug name,比如default等等,就可以判断具体是哪个分类
  • tag:第一个参数设为tag,可以判断当前页是否为标签文章页,第二个参数传入具体标签slug name,比如typecho等等,就可以判断具体是哪个标签
  • date:第一个参数设为date,可以判断当前页是否为日期归档文章页,第二个参数传入year,month或者day,就可以判断是否为按年,按月还是按日归档
  • single:第一个参数设为single,可以判断当前页是否为内容页,比如文章页,独立页面,附件显示页
  • post:第一个参数设为post,可以判断当前页是否为内容页,第二个参数传入文章id,就可以判断具体是哪篇文章
  • page:第一个参数设为page,可以判断当前页是否为独立页面,第二个参数传入页面slug name比如about,就可以判断具体是哪则独立页面
  • attachment:第一个参数设为attachment,可以判断当前页是否为附件,第二个参数传入附件id,就可以判断具体是哪个附件

原文地址:typecho单页面屏蔽百度蜘蛛 by 雪鼬博客

标签:typecho

评论已关闭