欧美亚洲中文,久久久久久久99精品免费线观看亚洲,3D精品重囗动漫巨大23,揄拍手机视频在线

  • <pre id="xtmtt"></pre>
    • <ul id="xtmtt"><source id="xtmtt"></source></ul>

      1. <dfn id="xtmtt"><cite id="xtmtt"></cite></dfn>

        云南網(wǎng)站建設(shè)創(chuàng)新企業(yè) 昆明多彩網(wǎng)絡(luò)公司

        用php實現(xiàn)的小偷程序原理

        來源:昆明網(wǎng)絡(luò)公司 日期:2010-09-15 閱讀: 發(fā)表評論

        很多站因為無法及時更新網(wǎng)站信息,所以都采用了程序自動采集網(wǎng)絡(luò)新聞的做法,這里我們來說一下php的自動采集原理。

        1、確定采集的網(wǎng)站目標。

        2、使用file_get_contents來獲取遠程網(wǎng)站的內(nèi)容存儲到某個變量當(dāng)中。

        3、構(gòu)建正則表達式,提取需要的內(nèi)容,并循環(huán)存儲到數(shù)據(jù)庫中。

        該任務(wù)的主要技術(shù)難點有以下:

        1、正則表達式的構(gòu)建,需要重復(fù)測試并且試驗一段時間。

        2、對方采取一些了防采集的措施,比如,網(wǎng)頁內(nèi)容規(guī)律的刻意打亂,服務(wù)器端的檢測,對內(nèi)容讀取時間頻率的控制等等。

        發(fā)表評論評論列表(有 條評論)