V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐关注
Meteor
JSLint - a JavaScript code quality tool
jsFiddle
D3.js
WebStorm
推荐书目
JavaScript 权威指南第 5 版
Closure: The Definitive Guide
nuist
V2EX  ›  JavaScript

jsoup 解析html问题

  •  
  •   nuist · 2013-09-15 19:05:57 +08:00 · 3581 次点击
    这是一个创建于 4090 天前的主题,其中的信息可能已经有所发展或是发生改变。
    .........

    <li><span>2013-09-10</span> [保卫处] <a href="/tjxw/buchudongtai/2013-09-10/5455.shtml" title="保卫处积极做好2013年迎新安全保卫工作" target="_blank">保卫处积极做好2013年迎新安全保卫工作</a></li>

    <li><span>2013-09-09</span> [区域培训中心] <a href="/tjxw/buchudongtai/2013-09-09/5431.shtml" title="新加坡天气预报员培训班开班" target="_blank">新加坡天气预报员培训班开班</a></li>

    .........

    1. 请问怎么解析出如上列表中 [XXX] 内容?



    2. 其余需要解析的内容方法如下,请问有什么修改建议吗?
    String date = ele.select("span").text();
    String title = ele.select("a").attr("title");
    String link = ele.select("a").attr("href");
    7 条回复    1970-01-01 08:00:00 +08:00
    chemhack
        1
    chemhack  
       2013-09-15 19:08:12 +08:00   ❤️ 1
    1. 你可以取li的第二个child
    2. 没问题
    nuist
        2
    nuist  
    OP
       2013-09-15 19:10:04 +08:00
    @chemhack 请问怎么取child??
    nuist
        3
    nuist  
    OP
       2013-09-15 19:24:23 +08:00
    @chemhack

    ele.child(0).text(); //2013-09-10
    ele.child(1).text(); //保卫处积极做好2013年迎新安全保卫工作

    取不到 [保卫处]

    。。。。
    twd2
        4
    twd2  
       2013-09-15 19:58:01 +08:00   ❤️ 1
    "\[(?<text>.+?)\]"
    chemhack
        5
    chemhack  
       2013-09-15 20:07:59 +08:00   ❤️ 1
    @nuist 是nodes的child,jsoup的child默认是element,text node不在内
    frittle
        6
    frittle  
       2013-09-15 20:09:42 +08:00   ❤️ 1
    .ownText()
    nuist
        7
    nuist  
    OP
       2013-09-15 20:51:53 +08:00
    @chemhack
    @frittle
    @twd2

    谢谢你们,搞定了~!
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3414 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 12:02 · PVG 20:02 · LAX 04:02 · JFK 07:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.