亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > PHP > 正文

PHP擴展curl和正則表達式輕松采集新聞

2020-03-24 17:10:41
字體:
來源:轉載
供稿:網友
采集已經不是什么新名詞了,很多站長為了省事,也局限于人力的缺乏,使用程序來給自己的網站添磚加瓦,比如本人的個人網站www.xxfsw.com也采集了大量的新聞,那么如果實現呢?今天我們運用php來實現這個功能。談到采集,我們不得不說兩個東西,第一個是如何獲取遠程網站的源代碼,這個可以通過php的一個擴展curl來獲取,另一個是如果去匹配你需要的信息,這個的解決辦法是html' target='_blank'>正則表達式。Windows下開啟curl的方法如下:1、拷貝PHP目錄中的libeay32.dll, ssleay32.dll, php5ts.dll, php_curl.dll文件到 system32 目錄。2、修改php.ini:配置好 extension_dir ,去掉 extension = php_curl.dll 前面的分號。3、重起apache。Linux下開啟curl的方法如下:進入安裝 原php 的源碼目錄,cd ext
cd curl
phpize
./configure --with-curl =DIR
make就會在PHPDIR/ext/curl /moudles/下生成curl .so的文件。復制curl .so文件到extensions的配置目錄,修改php .ini就好了。然后你就可以利用curl來獲取到指定url的網頁源碼了,這里給大家一個封裝好的函數
以下為引用的內容:
function getwebcontent($url){
$ch = curl_init();
$timeout = 10;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1);
$contents = trim(curl_exec($ch));
curl_close($ch);
return $contents;
}
以下為引用的內容:
p+匹配至少一個含p的字符串
p*陪陪任何包含0個或多個p的字符串
p?匹配任何包含0個或一個p的字符串
p{2}匹配包含2個p的序列的字符串
p{2,3}匹配任何包含2個或3個的字符串
p$匹配任何以p結尾的字符串
^p匹配任何以p開頭的字符串
[^a-zA-Z]匹配任何不包含a-zA-Z的字符串
p.p匹配任何包含p、接下來是任何字符、再接下來有又是p的字符串
^.{2}$匹配任何值包含2個字符的字符串
b (.*)b 匹配任何被 b 包圍的字符串
p(hp)*匹配任何一個包含p,后面是多個或0個hp的字符串
以下為引用的內容:
[:alpha:]同[a-zA-Z]
[:alnum:]同[a-zA-Z0-9]
[:cntrl:]匹配控制字符,比如制表符,反斜杠,退格符
[:digit:]同[0-9]
[:graph:]所有ASCII33~166范圍內可以打印的字符
[:lower:]同[a-z]
[:punct:]標點符號
[:upper:]同[A-Z]
[:space:]空白字符,可以是空格、水平制表符、換行、換頁、回車
[:xdigit:]十六進制符同[a-fA-F0-9]
以下為引用的內容:
?php
header( Content-type: text/html; charset=utf-8
getinfo( http://rss.sina.com.cn/rollnews/news/gn_total.js ,1);
getinfo( http://rss.sina.com.cn/rollnews/news/gj_total.js ,2);
getinfo( http://rss.sina.com.cn/rollnews/news/sh_total.js ,3);
getinfo( http://rss.sina.com.cn/rollnews/sports/sports_total.js ,4);
getinfo( http://rss.sina.com.cn/rollnews/tech/tech1_total.js ,5);
getinfo( http://rss.sina.com.cn/rollnews/finance/finance1_news_total.js ,6);
getinfo( http://rss.sina.com.cn/rollnews/ent/ent_total.js ,7);
getinfo( http://rss.sina.com.cn/rollnews/jczs/jczs_total.js ,8);
function getinfo($infourl,$catid)
{
$pagecontent=getwebcontent($infourl);
preg_match_all( /title:/ (.*?)/ / , $pagecontent, $match);
$titlearr=$match[1];
preg_match_all( /link:/ (.*?)/ / , $pagecontent, $match);
$urlarr=$match[1];
for ($i=1;$i count($urlarr);$i++){
echo go {$titlearr[$i-1]}/n
$title=iconv( gbk , utf-8 ,$titlearr[$i-1]);
$content=iconv( gbk , utf-8 ,getnewscontent($urlarr[$i]));
$content=mysql_escape_string($content);
if(!insertdb($title,$content,$catid)) break;
}
}
function insertdb($title,$content,$catid){
將數據寫入你的庫
}
function getnewscontent($newsurl){
$newscontent=getwebcontent($newsurl);
preg_match_all( / div > $content=preg_replace( / a.*? //a /si , ,$match[1][0]);
$content=preg_replace( / div > $content=preg_replace( / div > $content=str_replace( div > return $content;
}
function getwebcontent($url){
$ch = curl_init();
$timeout = 10;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1);
$contents = trim(curl_exec($ch));
curl_close($ch);
return $contents;
}
?
然后如何實現比較實時的同步呢,這可以利用windows下的任務計劃或linux下的crontab 了,定時(比如十分鐘)執行這個程序,這樣,你就不再愁網站沒有內容了,哈哈,另外本人開了個工作室www.beijingjianzhan.com(北京建站),我們開發了一個系統,不僅能夠采集信息,而且能自動地進行再加工,進行偽原創,這樣就更符合搜索引擎的品味了,讓你的網站瘋狂地被收錄吧,另外可以加我的Q376504340討論技術性話題。html教程

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
久久精品一区中文字幕| 在线视频免费一区二区| 麻豆精品精华液| 97视频免费在线看| 国产精品久在线观看| 国产精品一二三视频| 亚洲美女在线视频| 国产精品久久久亚洲| 久久久久免费精品国产| 欧美限制级电影在线观看| 国产色综合天天综合网| 日韩在线免费高清视频| 日韩一区二区三区国产| 欧美大码xxxx| 欧美韩国理论所午夜片917电影| 亚洲一区二区三区在线免费观看| 2023亚洲男人天堂| 精品国产电影一区| 亚洲夜晚福利在线观看| 精品亚洲一区二区| 欧美激情亚洲综合一区| 一区二区三区四区在线观看视频| 亚洲最新视频在线| 久久久久久久色| 亚洲最大福利视频| 91夜夜未满十八勿入爽爽影院| 亚洲第一精品自拍| 国产一区二区在线播放| 伊人久久精品视频| 日韩免费中文字幕| 欧美精品免费看| 亚洲欧美日韩爽爽影院| 亚洲精品免费在线视频| 亚洲视频综合网| 日韩欧美成人免费视频| 美日韩在线视频| 国产亚洲欧美日韩美女| 91国产精品电影| 日韩第一页在线| 国产成人短视频| 色婷婷综合久久久久中文字幕1| 91亚洲va在线va天堂va国| 亚洲老板91色精品久久| 欧美激情一区二区三区高清视频| 亚洲欧美日韩精品久久亚洲区| 欧美精品精品精品精品免费| 欧美午夜电影在线| 日韩欧美视频一区二区三区| 久久精品国产一区二区电影| 亚洲最大福利网站| 清纯唯美亚洲激情| 久久精品99国产精品酒店日本| 日韩免费在线播放| 亚洲欧美www| 亚洲第一黄色网| 91精品国产91久久| 国产主播喷水一区二区| 久久久女人电视剧免费播放下载| 久久精品国产69国产精品亚洲| 91av福利视频| 亚洲黄色有码视频| 亚洲综合国产精品| 国产精品夜色7777狼人| 欧洲亚洲女同hd| 亚洲人午夜精品| 91免费看片在线| 国产精品第100页| 在线视频亚洲欧美| 97视频色精品| 日本不卡免费高清视频| 成人自拍性视频| 欧美巨乳在线观看| 欧美日韩成人黄色| 中文字幕精品www乱入免费视频| 色综合伊人色综合网| 国产精品福利久久久| 成人一区二区电影| 成人国内精品久久久久一区| 欧美亚洲第一页| 亚洲一区免费网站| 欧美成人剧情片在线观看| 亚洲天堂第二页| 欧美韩国理论所午夜片917电影| 亚洲精品av在线| 色小说视频一区| 亚洲成人激情在线观看| 亚洲激情小视频| 久久频这里精品99香蕉| 亚洲春色另类小说| 懂色aⅴ精品一区二区三区蜜月| 精品亚洲精品福利线在观看| 中文字幕久久久av一区| 97av在线播放| 日韩在线观看av| 岛国av一区二区在线在线观看| 国产精品中文字幕在线观看| 国产91露脸中文字幕在线| 欧美精品在线视频观看| 亚洲va码欧洲m码| 久久精品中文字幕电影| 国产精品91视频| 欧美成人性生活| 亚洲欧美成人一区二区在线电影| 国产亚洲精品va在线观看| 韩日欧美一区二区| 97在线视频一区| 欧美放荡办公室videos4k| 精品免费在线观看| 日本不卡视频在线播放| 日韩av电影在线播放| 日韩女在线观看| 日韩电影中文 亚洲精品乱码| 精品亚洲一区二区三区在线播放| 国产精品三级在线| 日韩欧美精品免费在线| 久久久久久国产精品三级玉女聊斋| 日本精品久久中文字幕佐佐木| 神马国产精品影院av| 亚洲精品久久久久久下一站| 91免费欧美精品| 国内偷自视频区视频综合| 欧美www在线| 国产精品扒开腿做爽爽爽的视频| 欧美激情视频网址| 日韩成人高清在线| 色综合91久久精品中文字幕| 亚洲老头老太hd| 国产精品久久久av久久久| 亚洲欧美精品伊人久久| 136fldh精品导航福利| 欧美在线性视频| 亚洲一区二区三区毛片| 亚洲色图第一页| 国产精品久久久久久久久男| 亚洲自拍小视频| 人体精品一二三区| 久久精品99国产精品酒店日本| 国产剧情日韩欧美| 91国产精品视频在线| 91成人福利在线| 97精品久久久中文字幕免费| 国产一区二区三区在线免费观看| 国产丝袜一区视频在线观看| 亚洲电影免费在线观看| 国产成人精品视| 国产精品久久久久久久av电影| 久久精品99国产精品酒店日本| 中文字幕亚洲专区| 性欧美办公室18xxxxhd| 6080yy精品一区二区三区| 青青在线视频一区二区三区| 97在线视频免费看| 欧美精品日韩www.p站| 免费成人高清视频| 亚洲香蕉av在线一区二区三区| 国产精品va在线播放我和闺蜜| 欧美激情视频给我| 成人中文字幕+乱码+中文字幕| 亚洲天堂第二页| 亚洲美女福利视频网站| 国产精品视频99| 亚洲电影免费观看高清完整版在线观看| 国模私拍一区二区三区| 久久久av亚洲男天堂|