1
opengps 2020-10-13 14:20:49 +08:00
建议不要对需要登陆状态的数据进行爬取
|
4
EricJia OP @opengps #3 好的,我现在看到爬虫都有点担惊受怕, 感觉只能个人偷偷用, 但是像 京价保之类的插件 应该也算违法了吧?
|
5
opengps 2020-10-13 20:44:06 +08:00
@EricJia 未必。 是否判定为违法:一是看是否法律明确规定禁止,被禁止则必然违法;二是看对方是否提起诉讼引起法律讨论,讨论结果可能属于违法。
按照这个边界,去谨慎开发就行,有些需求从一开始就是危险的,自己研究没人追究一般触碰不到违法边缘,但是要公开服务获利,还是慎重为妙。 我个人感觉,你这个记账需求,是至少出发点没“未经用户允许”,还不至于担心这个。毕竟即使不用工具,用户自己也能复制出来页面信息 |
6
opengps 2020-10-13 20:46:02 +08:00
需要慎重处理的就是,别因为你的工具,给京东造成严重后果。我网站当时被人疯狂爬取的时候,1 核的 cpu 爆满到无法连接上服务器
|
7
EricJia OP @opengps #5 感谢您的回复, 我写的爬虫仅限于让用户 自己手动执行 获取自己的订单记录, 没有公开服务,我只是提供了公开源代码。
我看了很多新闻, 如果给网站带来严重后果 /侵犯用户隐私 /不正当牟利, 基本就进去了。 1. 带来严重后果: 用户自己执行,疯狂爬不把自己账号 block 了? 2. 侵犯用户隐私: 同上,应该是没问题,用户完全之情,并且主动运行代码的。 3. 比较麻烦,毕竟我提供这个工具, 是为了方便 App 用户的,App 本身存在收费行为。 |
9
EricJia OP @opengps #8 https://github.com/ericjjj/jdorders/blob/main/README.md 您看下合适吗? 参考了 crawlab
|
11
127000 2020-10-14 00:01:05 +08:00
|
12
lxilu 2020-10-14 00:13:37 +08:00 via iPhone
「等非法手段」病句
|
13
black11black 2020-10-14 00:31:45 +08:00
看了看,没必要为了这么个小项目考虑这么多,有什么一定要把这个东西贴到 github 上的理由吗?
|
15
EricJia OP @black11black #13 要公开, 但是怕法律问题
|