V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lazycat
V2EX  ›  程序员

有木有大牛能帮忙写一个小小的脚本?批量保存内容的。。。

  •  
  •   lazycat · 2013-06-25 00:26:33 +08:00 · 3356 次点击
    这是一个创建于 3959 天前的主题,其中的信息可能已经有所发展或是发生改变。
    是这样,高考成绩最近不是出来了么,我想要把我们学校同学的成绩都下载下来。。。手动太麻烦了,所以问问大牛们能不恩呢该帮帮我写一个小脚本,批量把内容下载下来。
    页面是 http://www.sjzjyksxx.com.cn/exam/depts/result.aspx?id=1&zid=1 很简单的一个页面,一个输入框一个按钮,考生号从 13130105150000 到13130105150620 如果能把内容全部放在一个表格中分类放好或者弄到一个数据库中当然最好,如果不行的话哪怕另存为一大堆文件(文本或者HTML),以姓名为文件名也可以接受。。。
    脚本么 本人Linux和Windows的服务器都有,PHP或者写的小程序或者SH或者BAT脚本都可以的。。。其他语言写的也可以,我可以装运行环境的。。。

    先谢了~
    7 条回复    1970-01-01 08:00:00 +08:00
    vibbow
        1
    vibbow  
       2013-06-25 00:47:08 +08:00
    我又想用万能的Selenium了,怎么破...
    pityonline
        2
    pityonline  
       2013-06-25 00:59:11 +08:00 via Android
    for i in {1000..1999}; do wget http://www.test.com/xxx.aspx?id=${i}&zid=${i}; done
    手机打的,自己看着改吧,想直接取内容可能需要 iconv 转换一下再 grep 成绩关键字,再重定向一下也可以……
    binux
        3
    binux  
       2013-06-25 01:26:10 +08:00   ❤️ 1
    for i in {0..620}; do a=`expr 13130105150000 + $i`; curl -s -d '__VIEWSTATE=%2FwEPDwUKLTkyNzU2NzIyNQ9kFgICAw9kFgICAQ9kFgQCAQ8PFgIeBFRleHQFMOmrmOiAg%2BaIkOe7qeafpeivou%2B8iOS7hemZkOefs%2BWutuW6hOW4guiAg%2BeUn%2B%2B8iWRkAgMPDxYCHwAFDOiAg%2BeUn%2BWPt%2B%2B8mmRkZJF4D5%2BJKIzL6NRRoQbMxKeIMTin&__EVENTVALIDATION=%2FwEWBQKS3KfXCQLEuKKdAwKln%2FPuCgK17cLhAQKyt7rPBEXzvHlNLLgUsV4%2Bo4evX8%2BW1ikj&tbZKZ='$a'&btnSearch=%E6%9F%A5+%E8%AF%A2&hfID=1&hfZID=1' 'http://www.sjzjyksxx.com.cn/exam/depts/result.aspx?id=1&zid=1' | grep '<td bordercolordark=' | awk '{ if (NR%2==0 && NR!=8) print }' | sed -E 's/[^>]+> *([^ <]+) *<.*/\1/' | awk -v ORS=" " '{ print }' && echo -e ""; done
    binux
        4
    binux  
       2013-06-25 01:30:58 +08:00
    | sort -k13nr | head -n10
    lecher
        5
    lecher  
       2013-06-25 01:59:33 +08:00
    @binux 运用的好熟练,统计完的最高分是697
    lazycat
        6
    lazycat  
    OP
       2013-06-25 09:58:52 +08:00
    @binux 谢了,回家了试试。现在在学校,嘿嘿。。。
    linuxer
        7
    linuxer  
       2013-06-25 14:55:15 +08:00
    在Firefox 21.0下看3L的代码都撑开容器出现水平滚动条了。感觉还是写成.reply_content { word-break: break-all;}好点。让这些非“正常”的字符也换行。@Livid
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2852 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 07:20 · PVG 15:20 · LAX 00:20 · JFK 03:20
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.