首页 > PHP,好久不见 > 网页源代码与cURL获取到的数据不符
2015
03-06

网页源代码与cURL获取到的数据不符

最近在做图书馆检索,用到了PHP的cURL和正则表达。

今天遇到一个匹配不到的问题,原本以为是正则规则写错了,但后来发现,其实是正则中的文本不符。

一般情况下我是通过ctrl U 查看网页源代码来写正则规则的。通过源代码可以看到这次我要匹配的是。其中我要匹配的是1899.

<span id=”ctl00_ContentPlaceHolder1_countlbl style=”color:Red;>1899</span>

于是我使用了下面的规则:

#<span id=”ctl00_ContentPlaceHolder1_countlbl style=”color:Red;>([^”]+)</span>#iUs

但始终无法匹配出结果。后来将cURL获取到的网页数据输出来,看到的数据竟然和网页源代码的不一致:

<span id=”ctl00_ContentPlaceHolder1_countlbl“><font color=”Red“>1899</font></span>

至此匹配的问题解决。

现在仍然无法理解缘何不同,若游客有见解,留下言吧 :)

最后编辑:
作者:foam
foam
这个作者貌似有点懒,什么都没有留下。

网页源代码与cURL获取到的数据不符》有 2 条评论

  1. illuz 说:

    可能是 User Agent 或 Cookie 所致。

留下一个回复

你的email不会被公开。