V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
aaa0009
V2EX  ›  问与答

这个公司的 IP 一直恶意爬行我们的网站,如何找到对方的联系方式并警告?

  •  
  •   aaa0009 · 2016-10-08 11:30:38 +08:00 · 5317 次点击
    这是一个创建于 2974 天前的主题,其中的信息可能已经有所发展或是发生改变。
    第 1 条附言  ·  2016-10-08 20:39:50 +08:00
    感谢 @rhen , 提供最有效的信息: https://aws.amazon.com/forms/aws-china-report-abuse/

    反恶意访问我们也是有的,只要访问页面超过几百次,就拉黑三年。本来拉黑是 PHP 拉黑的,效率有点低,目前已升级成系统级拉黑了。不过投诉还是要的,本能让坏人这么嚣张。
    第 2 条附言  ·  2016-10-09 16:21:25 +08:00
    联系了光华新网,对方回应:
    我公司对用户信息有义务进行保密,不方便将客户联系信息透漏给第三方公司,还请谅解。我公司为固定 IP ,如存在恶意攻击行为,还请贵司采取技术手段进行屏蔽。
    24 条回复    2016-10-15 11:10:17 +08:00
    bugmenein
        1
    bugmenein  
       2016-10-08 11:40:01 +08:00
    并卵,国内这种事情没法解决,只能你们自己 ban 了他们 IP 。
    greatghoul
        2
    greatghoul  
       2016-10-08 11:46:20 +08:00
    aaa0009
        3
    aaa0009  
    OP
       2016-10-08 12:14:54 +08:00
    @bugmenein IP 又程序 Ban ,不过对方 IP 实在多。
    aaa0009
        4
    aaa0009  
    OP
       2016-10-08 12:15:11 +08:00
    @aaa0009 IP 已经 Ban 了 ,不过对方 IP 实在多。
    Marfal
        5
    Marfal  
       2016-10-08 12:15:52 +08:00
    swen
        6
    swen  
       2016-10-08 13:08:59 +08:00
    给他脏数据
    aaa0009
        7
    aaa0009  
    OP
       2016-10-08 13:24:27 +08:00
    @swen 现在主要问题是对方 IP 太多,影响网站速度了。
    c0878
        8
    c0878  
       2016-10-08 13:36:37 +08:00
    反爬虫措施网上搜下很多的吧 警告对方甚至寄律师函基本都是无效 还是从技术手段上来解决
    yghack
        9
    yghack  
       2016-10-08 13:40:34 +08:00
    @aaa0009 爬都是有特征的,根据特征写个脚本自动封吧。
    上周就遇到这种情况,封了几千了 IP 。
    lbp0200
        10
    lbp0200  
       2016-10-08 13:44:18 +08:00
    也可能是光环新网的对外 ip ,就像长城宽带,全北京的长宽用户都是一个 IP 。
    qwer1234asdf
        11
    qwer1234asdf  
       2016-10-08 15:04:56 +08:00 via iPhone
    吓得赶紧看了下线上 server 的 ip
    lecher
        12
    lecher  
       2016-10-08 15:45:29 +08:00 via Android
    给服务器托管商发律师函,以他们托管的服务器存储有你们公司独家版权的内容要求对方下线这些内容。

    然后这个皮球就会被托管商乖乖踢给使用者,并且会把使用者的预留信息回复给你。
    beagle11
        13
    beagle11  
       2016-10-08 16:12:00 +08:00
    设定一个规则,加验证码
    Tony2ee
        14
    Tony2ee  
       2016-10-08 16:14:28 +08:00
    @lbp0200 全北京的长宽用户都是一个 IP ?天呐
    一个用户对百度做了不当行为全北京都被验证码?
    ytmsdy
        15
    ytmsdy  
       2016-10-08 16:38:01 +08:00
    我是这么干的:
    策略 1 :把访问 ip 丢到数据库里面。 1 小时清一次,如果一个小时里面的访问数量超过多少。就直接乱给脏数据(不报错,也不屏蔽)!
    策略 2 :很多爬虫都伪装成搜索引擎的 bot 来抓取,抽查一部分的搜索引擎的请求,查询访问的 ip 是否在搜索引擎的爬虫 ip 池里面,如果不在,还是给它脏数据!
    sunsol
        16
    sunsol  
       2016-10-08 16:44:25 +08:00
    如果是长宽反而不会有爬虫吧,好像长宽自己就有代理缓冲减少访问流量.
    lbp0200
        17
    lbp0200  
       2016-10-08 16:55:48 +08:00
    @Tony2ee 百度当然不可能用 ip 来区分用户
    rhen
        18
    rhen  
       2016-10-08 18:32:06 +08:00 via Android
    光环新网。。。这个不是 AWS 中国吗
    rhen
        19
    rhen  
       2016-10-08 18:32:48 +08:00 via Android   ❤️ 1
    应该是用亚马逊 AWS 中国的服务器搞的,去那边投诉试试
    rhen
        20
    rhen  
       2016-10-08 18:34:59 +08:00 via Android
    如果真的是 AWS 中国的话 去这里投诉滥用 https://aws.amazon.com/forms/aws-china-report-abuse/
    ik
        21
    ik  
       2016-10-08 18:51:26 +08:00 via iPhone
    吓屎我了,我还以为我司爬虫段被封了😿
    aaa0009
        22
    aaa0009  
    OP
       2016-10-08 20:44:09 +08:00
    @rhen 晕咯, AMS 说不是他家的 IP 。找 Guanghuan Xinwang 投诉?
    alect
        23
    alect  
       2016-10-08 21:51:11 +08:00
    光环新网的 ip ,很多 IDC 其实就是租用或者托管在他们的机房
    爬虫这个事儿,你封 IP 不就好了,反正没正常访客。
    kozora
        24
    kozora  
       2016-10-15 11:10:17 +08:00
    @rhen aws 的 ip 都是有反向记录的 我查了楼主这几个 都没有
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2870 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 12:30 · PVG 20:30 · LAX 04:30 · JFK 07:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.