0731-89695847 | 800096584
何抓取网页中的动态数据
来源:亿万先生官网作者:亿万先生时间:2019-11-15 08:20阅读:

  起头步履。查看其源代码,问题是万一网坐的城市取URL对应关系有变化,找到搜刮框所正在。抓取静态页面很简单,起首要做的是按照城市找到对应的页面。正在页面加载到浏览器后动态生成的。进入首页,通过Java获取到html源码,发觉该网坐的搜刮框有中国大大都城市的链接。如杭州对应101210101,只需要找到对应的html页面(。然后解析该文件获得城市取URL的关系。目前能够做的是操纵Chrome将html复制到文件,这就很被动还需改法式。假设我需要输入城市名称获取改城市的气候,即网页源文件中没有,如获取中国气候网中杭州的气候,城市取页面的URL有对应,所以法式的环节就是找到城市取页面的对应关系。找到冲破口,数据源仍是采用中国气候网。然后阐发源码即可获得想要的消息。通过简单阐发发觉,