V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zhaojjxvi
V2EX  ›  正则表达式

关于跨行匹配包含空格的字符串

  •  
  •   zhaojjxvi · 2017-03-18 16:20:31 +08:00 · 1607 次点击
    这是一个创建于 2567 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近在自学 Python ,遇到个如题的问题。

    这个网站: ATP Ranking

    试着去抓里面国家 /地区名简写与全称的列表,源代码大概如下:

    我在交互界面用 re.findall 和 request.urlopen 以及如下 Pattern 算是误打误撞匹配出来

    '([A-Z]{3})“.*?([A-Z].*?)\\r\\n'
    

    这个是效果:

    但是用 Spyder 写成 py 就不行了,纠结了不少天,找了不少资料,始终没有想到问题在哪儿。

    Python 新手,特来请教,谢谢!

    3 条回复    2017-03-18 21:44:27 +08:00
    gamexg
        1
    gamexg  
       2017-03-18 20:11:22 +08:00 via Android
    看着别扭,重写了个

    data value="([^"]*?)"[^>]*?>([^<]+?)<

    大概这样,手机写的。
    zhaojjxvi
        2
    zhaojjxvi  
    OP
       2017-03-18 21:16:09 +08:00 via iPhone
    @gamexg
    多谢!
    第二对圆括号之间是不是会包含\n, \t 什么的?
    gamexg
        3
    gamexg  
       2017-03-18 21:44:27 +08:00   ❤️ 1
    @zhaojjxvi #2

    data-value="([^"]*?)"[^>]*?>\s*([^\s<]+?)\s*<

    加个\s 匹配空格等可以排除 \n\t 。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2819 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 15:25 · PVG 23:25 · LAX 08:25 · JFK 11:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.