php远程获取网站的关键字信息(并附:php判断字符串编码)
很明显,php100是gbk编码的网站。现在获取它的关键字,并无乱码的显示出来,然后好保存到数据库。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
<meta http-equiv=
"Content-Type"
content=
"text/html; charset=UTF-8"
/>
<?php
function
check_utf8(
$checkString
){
if
(preg_match(
"/^(["
.
chr
(228).
"-"
.
chr
(233).
"]{1}["
.
chr
(128).
"-"
.
chr
(191).
"]{1}["
.
chr
(128).
"-"
.
chr
(191).
"]{1}){1}/"
,
$checkString
) == true || preg_match(
"/(["
.
chr
(228).
"-"
.
chr
(233).
"]{1}["
.
chr
(128).
"-"
.
chr
(191).
"]{1}["
.
chr
(128).
"-"
.
chr
(191).
"]{1}){1}$/"
,
$checkString
) == true || preg_match(
"/(["
.
chr
(228).
"-"
.
chr
(233).
"]{1}["
.
chr
(128).
"-"
.
chr
(191).
"]{1}["
.
chr
(128).
"-"
.
chr
(191).
"]{1}){2,}/"
,
$checkString
) == true){
return
true;
}
else
{
return
false;
}
}
$meta
= get_meta_tags(
'http://www.php100.com'
);
echo
'源数据:'
.
$keywords
=
$meta
[
'keywords'
];
echo
'<pre /><pre />'
;
if
(check_utf8(
$keywords
) == 0){
$keywords
= iconv(
"GBK"
,
"UTF-8"
,
$keywords
);
}
$keywords
=
explode
(
','
,
$keywords
);
$keywords
=
array_map
(
'trim'
,
$keywords
);
// 函数返回用户自定义函数作用后的数组【去除空格】
$keywords
=
array_filter
(
$keywords
);
//如果没有提供 callback 函数,array_filter() 将删除 input 中所有等值为 FALSE 的条目。
print_r(
$keywords
);
?>
|
本文转自许琴 51CTO博客,原文链接:http://blog.51cto.com/xuqin/1349694,如需转载请自行联系原作者