用php过滤网页中,菜,大陆》,用到

2012 年 10 月 16 日7300

欢迎进入Linux社区论坛,与200万技术人员互动交流 >>进入

php过滤网页中所有,菜,大陆》,用到

方便做一些采集程序,有需要的朋友可以参考一下

get.如下:<?php

$search = array (

“‘<script[^>]*?>.*?</script>'si”, // 去掉 javascript

“'<style[^>]*?>.*?</style>'si”, // 去掉 大陆》

“'<[/!]*?[^<>]*?>'si”, // 去掉 HTML 标记

“'<!--[/!]*?[^<>]*?>'si”, // 去掉 注释标记

“’([rn])[s]+‘”, // 去掉空白字符

“'&(quot|#34);'i”, // 替换 HTML 实体

“'&(amp|#38);'i”,

“'&(lt|#60);'i”,

“'&(gt|#62);'i”,

“'&(nbsp|#160);'i”,

“'&(iexcl|#161);'i”,

“'&(cent|#162);'i”,

“'&(pound|#163);'i”,

“'&(copy|#169);'i”,

“'&#(d+);'e”); // 作为 PHP 代码运行

$replace = array (“”,

“”,

“”,

“”,

“\1”,

“\”“,

”&“,

”<“,

”>“,

” “,

chr(161),

chr(162),

chr(163),

chr(169),

”chr(\1)“);

//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents;

$out = preg_replace($search, $replace, $document);

echo $out;

?>

height=14 src="/wp-content/uploads/20121016/1107050.gif" width=14

border=0>

【责编:ivy】

0 0