V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
akeyz
V2EX  ›  问与答

抓取页面算不算网站 PV

  •  
  •   akeyz · 2014-11-24 14:50:00 +08:00 · 3326 次点击
    这是一个创建于 3438 天前的主题,其中的信息可能已经有所发展或是发生改变。
    rt,程序抓取页面算不算网站pv
    21 条回复    2014-11-25 14:39:21 +08:00
    ChanneW
        1
    ChanneW  
       2014-11-24 14:53:26 +08:00   ❤️ 1
    感觉应该算的
    llhh
        2
    llhh  
       2014-11-24 14:55:23 +08:00   ❤️ 1
    看什么程序,看如何统计pv
    tabris17
        3
    tabris17  
       2014-11-24 14:56:15 +08:00   ❤️ 1
    看你如何统计的了,如果你统计代码是用JS做的,而抓取程序没有调用JS的话就不算
    akeyz
        4
    akeyz  
    OP
       2014-11-24 15:09:27 +08:00
    @ChanneW 首先,感谢回复;其次,我用的是cnzz去统计的,但是没算
    akeyz
        5
    akeyz  
    OP
       2014-11-24 15:10:18 +08:00
    @llhh 首先,感谢回复,其次,我用的是beautifulsoup去抓的,然后用的是cnzz去统计的,但是貌似不算。
    akeyz
        6
    akeyz  
    OP
       2014-11-24 15:11:34 +08:00
    @tabris17 首先,感谢回复,其次,用的是cnzz的统计。
    coolzjy
        7
    coolzjy  
       2014-11-24 15:17:09 +08:00
    @akeyz 可以在同一个回复中at若干用户来避免重复内容
    xujif
        8
    xujif  
       2014-11-24 15:23:27 +08:00
    cnzz之类是通过js统计的,抓取当然不算。服务的统计,抓,算
    akeyz
        9
    akeyz  
    OP
       2014-11-24 15:28:26 +08:00
    @coolzjy 好吧,不太会玩,受教了。
    akeyz
        10
    akeyz  
    OP
       2014-11-24 15:29:56 +08:00
    @xujif 也就是说,我抓取的时候要执行js,那样会统计,对吧。
    abelyao
        11
    abelyao  
       2014-11-24 15:30:09 +08:00   ❤️ 1
    抓取页面有两种,一种是纯粹抓取 HTML 代码 (A),另一种是抓了之后模拟浏览器执行 (B)。
    统计访问量也有两种,一种是通过 JS 去统计 (C) 例如 CNZZ 就是,另一种是在服务端对请求次数进行统计 (D)。
    那么:A+C 不统计,B+C 有统计,A+D 有统计,B+D 也有统计。
    A+C 不统计是因为抓了 HTML 代码之后,并没有执行到 JavaScript 的代码。
    akeyz
        12
    akeyz  
    OP
       2014-11-24 15:34:41 +08:00
    @abelyao 有没有什么可以用的lib,推荐一下,谢谢!
    abelyao
        13
    abelyao  
       2014-11-24 15:35:51 +08:00
    @akeyz 干嘛的 lib ?统计还是抓取?
    akeyz
        14
    akeyz  
    OP
       2014-11-24 15:41:24 +08:00
    @abelyao 就是你上面说的B,抓取并解析
    abelyao
        15
    abelyao  
       2014-11-24 15:43:30 +08:00
    @akeyz 哦,针对不同网站,抓取不同的内容吧,还有一些是模拟点击的也是点不同的按钮,所以我一般都是直接用 C# Winform 的浏览器控件写一个…
    akeyz
        16
    akeyz  
    OP
       2014-11-24 15:48:24 +08:00
    @abelyao 好的,谢谢了
    ChanneW
        17
    ChanneW  
       2014-11-24 18:09:37 +08:00
    你这是想自己刷统计么?
    ChanneW
        18
    ChanneW  
       2014-11-24 19:08:59 +08:00
    去看下这货 PyV8
    sunine
        19
    sunine  
       2014-11-24 19:16:03 +08:00 via Android
    可以参考一下这篇文章:http://m.blog.csdn.net/blog/lmh12506/7840326
    akeyz
        20
    akeyz  
    OP
       2014-11-25 14:38:23 +08:00
    @ChanneW 是的,谢谢了
    akeyz
        21
    akeyz  
    OP
       2014-11-25 14:39:21 +08:00
    @sunine 谢谢!
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3392 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 11:47 · PVG 19:47 · LAX 04:47 · JFK 07:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.