DIV标签中列表的获取方法

    昨天把JavaEye的头条获取过来,思路是这样的:

  1. 通过id获取div的源代码
  2. 通过正则表达式获取列表,以实现配置的通用性,只需改变正则表达式就可以获取不同的数据
  3. 通过正则表达式的分组获取头条的标题、title、链接

    javaEye头条的源代码如下:

   

    因为通过div的id属性获取还是非常方便的。配置程序获取的结果速度也很快。div分析结果如下:

   

    但是再要获取“Java编程和企业应用热点”下面的栏目时有点问题。这些模块都是根据<DIV Class>属性来排版的,没有ID属性,使用WebBrowser控件不能直接定位了,并且class属性不是唯一的,有多个。譬如“Java编程和企业应用热点”和“动态语言编程热点”的class都是<DIV class="forum left">,怎么获取呢?只有通过正则表达式了吧(欢迎高手讨论怎么获取?),获取后再通过正则表达式解析出来就可以了吧。

   

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值