面向搜索引擎的URL优化
ReadyGo!技术成就梦想
网络搜索
efish
2008-3-11 22:25:40
我在写晋远信息网(www.geofuture.net)时没有考虑到URL如何面向搜索引擎优化,完成了以后才开始优化的。这时要考虑一方面要静态的URL,一方面要尽量保持原有的程序不变以便于以后维护,所以就采用url_rewrite的方法。下面是httpd.conf中相应的部分
以下为引用的内容:
<VirtualHost *:80>
DocumentRoot /home/geofuture
ServerName www.geofuture.net
ServerAlias *.geofuture.net geofuture.net *.136z.com
DirectoryIndex index.files index.html index.php
RewriteEngine On
#RewriteLog logs/rewrite.log
#RewriteLogLevel 9
#RewriteRule / http://geofuture.vicp.net/
RewriteCond %{REQUEST_FILENAME} index.files
RewriteCond %{REQUEST_FILENAME} error.files
RewriteCond %{REQUEST_FILENAME} cat.files
RewriteCond %{REQUEST_FILENAME} area.files
RewriteCond %{REQUEST_FILENAME} info.files
RewriteCond %{REQUEST_FILENAME} topic.files
RewriteCond %{REQUEST_FILENAME} post.files
RewriteCond %{REQUEST_FILENAME} profile.files
RewriteCond %{REQUEST_FILENAME} userinfo.files
RewriteCond %{REQUEST_FILENAME} cert.files
RewriteCond %{REQUEST_FILENAME} revise.files
RewriteCond %{REQUEST_FILENAME} review.files
RewriteCond %{REQUEST_FILENAME} feedback.files
RewriteCond %{REQUEST_FILENAME} keyrank.files
RewriteCond %{REQUEST_FILENAME} rss.files
RewriteRule ^(.+?)\Q(.*)$ $1=$2
RewriteRule ^(.+?)ZZ(.+)$ $1&$2
RewriteRule ^(.+?)\.files(.*)$ $1.php$2
RewriteRule ^(.+?)\.php(/|&)(.+).html$ $1.php?$3
ErrorDocument 400 /error.php?status=400
ErrorDocument 401 /error.php?status=401
ErrorDocument 403 /error.php?status=403
ErrorDocument 404 /error.php?status=404
ErrorDocument 405 /error.php?status=405
ErrorDocument 408 /error.php?status=408
ErrorDocument 410 /error.php?status=410
ErrorDocument 411 /error.php?status=411
ErrorDocument 412 /error.php?status=412
ErrorDocument 413 /error.php?status=413
ErrorDocument 414 /error.php?status=414
ErrorDocument 415 /error.php?status=415
ErrorDocument 500 /error.php?status=500
ErrorDocument 501 /error.php?status=501
ErrorDocument 502 /error.php?status=502
ErrorDocument 503 /error.php?status=503
ErrorDocument 506 /error.php?status=506
</VirtualHost>
我只把以内容为主的栏目优化了,至于登录和搜索等部分保持不变,因为这些部分也是搜索引擎不关心的。同时,一些常见的状态码(HTTP Status)也有相应的静态页面。上面只修改了外来请求的URL,而程序生成的URL通过下面的代码实现:
以下为引用的内容:
<?php
//-------------- SECTION NAME -----------------------------------
// 动态URL改写成静态
function url_rewrite($buffer)
{
//return $buffer;
$search = array(
".php",
"?",
"&",
"filesZZ",
"=",
"hrefQ",
);
$replace = array(
".files",
"/",
"ZZ",
"files/ZZ",
"Q",
"href=",
);
preg_match_all("/href="\/(index|error|cat|area|info|topic| post|profile|userinfo|cert| revise|review|feeback|keyrank|rss) \.php(.*?)"/", $buffer, $match);
$url = str_replace($search, $replace, $match);
$url = preg_replace("/\.files(.+?)(#.+?)?"$/", ".files\\1.html\\2"", $url);
return str_replace($match, $url, $buffer);
}
?>
上面的函数定义放在公共头文件里面。然后,在需要优化的页面开始处加入以下代码:
ob_start("url_rewrite");
这也是原来的程序唯一需要修改的地方。这样做还有一个问题。 例如我写的分页函数等代码, 都要求原来动态的URL, 而优化了以后通过 $_SERVER."?".$_SERVER 就只能得到优化以后的静态URL, 所有依赖于动态URL的代码都得修改一下, 以能够处理原来的URL和优化的。这样得改写公共头文件的许多代码。所以我就想了一个迂回的办法:
以下为引用的内容:
<?php
//-------------- SECTION NAME -----------------------------------
// 恢复成动态URL
function url_resume($url)
{
$search = array(
".files",
".php/",
"ZZ",
"/ZZ",
"Q",
".html",
);
$replace = array(
".php",
".php?",
"&",
"?&",
"=",
"",
);
$url = str_replace($search, $replace, $url);
return $url;
}
?>
有了上面的函数,在需要动态URL的地方只要调用一下就可以了,而不需重写各个核心函数。需要注意的是,url_rewrite和url_resume虽然是相反的过程,但是它们的参数是不同的。前者的参数是整个缓冲区,后者只是一个单个的URL,因为恢复的情况毕竟很少,而全局处理重写可以提高速度。
-
相关文章
升级PHP5的理由:PHP4和PHP5性能对比
升级PHP5的理由:PHP4和PHP5性能对比
使用php的zlib压缩和解压缩swf文件
使用php的zlib压缩和解压缩swf文件
网管注意 PHP 5.2.5之前版本多个安全漏洞
网管注意 PHP 5.2.5之前版本多个安全漏洞
PHP连接远程MYSQL和MYSQL5.1中文乱码的处理方法!
PHP连接远程MYSQL和MYSQL5.1中文乱码的处理方法!
PHP技巧:php过滤危险html代码
PHP技巧:php过滤危险html代码
PHP5中新增加的日期(date)函数的常量
PHP5中新增加的日期(date)函数的常量
PHP动态网站开发中常用的8个小技巧
PHP动态网站开发中常用的8个小技巧
PHP程序中使用session错误调试问题
PHP程序中使用session错误调试问题
用PHP程序直接调用文本文件内容实例
用PHP程序直接调用文本文件内容实例
用 PHP V5 开发多任务应用程序
用 PHP V5 开发多任务应用程序
2秒记住本站域名
玩过泡泡龙吗?Readygo?Go! 再加上.Com.Cn的后缀,那就是大名小顶的ReadyGo.com.cn
