长期以来明月都是借助插件来生成站点地图(sitemap.xml)的,但是这类插件往往刚开始的时候都是“中规中矩”的,在有了一定的安装量后就会有各种捆绑的“推广”、“营销”类的动作让人是烦不胜烦呀,最近在部署 SSL 后,感觉需要向各个搜索引擎提交一下站点地图(sitemap.xml),想来想去还是免插件生成最好了,安全还高效!
其实站点地图(sitemap.xml)就是方便快捷的给搜索引擎蜘蛛指明道路的一个方式
<?php
require('./wp-blog-header.php');
header("Content-type: text/xml");
header('HTTP/1.1 200 OK');
$posts_to_show = 1000;
echo '<?xml version="1.0" encoding="UTF-8"?>';
echo '<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">'
?>
<!-- generated-on=<?php echo get_lastpostdate('blog'); ?> Diy By 菜鸟笔记(https://www.coonote.com/)-->
<url>
<loc><?php echo get_home_url(); ?></loc>
<lastmod><?php $ltime = get_lastpostmodified(GMT);$ltime = gmdate('Y-m-d\TH:i:s+00:00', strtotime($ltime)); echo $ltime; ?></lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<?php
/* 文章页面 */
$myposts = get_posts( "numberposts=" . $posts_to_show );
foreach( $myposts as $post ) { ?>
<url>
<loc><?php the_permalink(); ?></loc>
<lastmod><?php the_time('c') ?></lastmod>
<changefreq>monthly</changefreq>
<priority>0.6</priority>
</url>
<?php } /* 文章循环结束 */ ?>
<?php
/* 单页面 */
$mypages = get_pages();
if(count($mypages) > 0) {
foreach($mypages as $page) { ?>
<url>
<loc><?php echo get_page_link($page->ID); ?></loc>
<lastmod><?php echo str_replace(" ","T",get_page($page->ID)->post_modified); ?>+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.6</priority>
</url>
<?php }} /* 单页面循环结束 */ ?>
<?php
/* 博客分类 */
$terms = get_terms('category', 'orderby=name&hide_empty=0' );
$count = count($terms);
if($count > 0){
foreach ($terms as $term) { ?>
<url>
<loc><?php echo get_term_link($term, $term->slug); ?></loc>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
<?php }} /* 分类循环结束 */?>
<?php
/* 标签(可选) */
$tags = get_terms("post_tag");
foreach ( $tags as $key => $tag ) {
$link = get_term_link( intval($tag->term_id), "post_tag" );
if ( is_wp_error( $link ) )
return false;
$tags[ $key ]->link = $link;
?>
<url>
<loc><?php echo $link ?></loc>
<changefreq>monthly</changefreq>
<priority>0.4</priority>
</url>
<?php } /* 标签循环结束 */ ?>
</urlset>
代码不需要做任何的修改的,至于“版权信息”,明月真心建议各位保留,这毕竟是对作者的一个尊重嘛!
上述代码保存为 sitemap.php 文件(UTF-8 编码),上传到网站根目录,然后访问这个文件的链接即可实时的生成站点地图(sitemap.xml)了,很简单吧!
但是,这样生成的站点地图(sitemap.xml)其实就是“动态”的,这点儿对于服务器的性能还是会有小小的影响的,要是被“别有用心”的人利用,甚至会造成服务器直接宕机都有可能,在【张戈博客』上作者专门提供了“伪静态”和“纯静态”的方法,明月还是感觉“纯静态”的最是安全可靠了,就是需要站长拥有服务器的 root 权限,所以“虚拟主机”的可能就不适合了。
具体方法如下:
首先将代码保存为 sitemap.php(这里为了安全着想可以取任意名字的.php 文件,最好是让人猜不到的),然后将这个.php 文件放到网站根目录下一个只有你自己知道的目录里面,为了防止这个目录被遍历查询搜索出来,我们还可以通过赋予 root 群组用户权限来限制访问和获取,具体命令如:chown -R root:root 目录名称;只要替换“目录名称”为你设定的目录名称即可。
然后,给你的系统定时任务里添加一个定时执行的命令来定时的生成纯静态的 sitemap.xml 到网站个目录即可:
#每天在网站根目录生成一个 sitemap.xml diypath 为 sitemap.php 的实际位置和实际文件名哦!
0 1 * * * wget -O /home/wwwroot/web/sitemap.xml --no-check-certificate https://www.coonote.com/diypath/sitemap.php >/dev/null 2>&1
Ps:使用这个方法,注意 sitemap.php 里面的 require('./wp-blog-header.php'); 要改成 require('../wp-blog-header.php'); 也就是注意相对位置,切记!切记!切记!
如果是 HTTPS 站点,需要在 wget 指令里加上--no-check-certificate 的选项的哦,记得前后的空格即可。
好了,经过上述的部署后,基本上你网站纯代码生成的最安全的纯静态站点地图(sitemap.xml)就部署完成了,后期几乎不需要任何的人工干预,一起都是自动定时的生成的,当然你也可以根据你网站的更新频率以及时间间隔来调整“定时任务”的执行时间更加匹配
配置网站rotbots.txt
User-agent: AhrefsBot
Disallow: /
User-agent: BUbiNG
Disallow: /
User-agent: *
Disallow: /wp-*/
Disallow: /trackback/
Disallow: /comments/
Disallow: /attachment/
Disallow: /comments/feed
Disallow: /feed
Disallow: /*/feed
Disallow: /*/comment-page-*
Disallow: /tag/
Disallow: /author/
Disallow: /*?replytocom=*
Disallow: /*/trackback
Disallow: /wp-*.php
Disallow: /search/
Sitemap: http://xxxx.xxxx.xxx/sitemap.xml
Sitemap: http://xxxx.xxxx.xxx/sitemap.html