首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
宝塔
V2EX  ›  问与答

哪里可以爬到大量的中国人脸图片?用于训练 GAN

  •  
  •   zhihupron · 44 天前 · 4681 次点击
    这是一个创建于 44 天前的主题,其中的信息可能已经有所发展或是发生改变。
    目前网络上公开的数据集都说欧美人脸。我想训练自己的 GAN 网络。
    生成的的人脸都是欧美人。我想训练大陆人脸。
    国内有没有类似公开的数据集?或者适合爬虫爬取的网站
    32 回复  |  直到 2019-10-07 05:08:20 +08:00
        1
    GPLer   44 天前 via Android
    微博?
        2
    sadfQED2   44 天前 via Android
    我以前的做法是去网上爬各种各样的图片,然后用网上现成的模型过滤,把没有人脸的删掉,同时做 resize 等预处理
        3
    lishoujun   44 天前 via Android
    91p**n
        4
    ddhhh   44 天前
    xx 直播封面
        5
    ddhhh   44 天前
        6
    oubfgiar   44 天前 via iPhone
    给你提供一个思路,人事局,高校,各种继续教育系统。
        7
    Danswerme   44 天前 via Android
    xx 直播啥的不都是换头怪?
        8
    lzhd24   44 天前 via Android
    陌陌,探探。全是人脸。前提是技术到位,能爬的到:-)
        9
    aneureka   44 天前 via Android   ♥ 4
    有的,之前做 animate me 的时候了解过

    http://www.seeprettyface.com/mydataset_page2.html
        10
    caomu   44 天前 via Android   ♥ 1
    @oubfgiar 这倒是一个思路,之前的教务系统,人像一寸照片不设权限,学号递增编号,直接可以拉下来。。。
        11
    hkitdog   44 天前 via iPhone
    探探
        12
    chenchangjv   44 天前   ♥ 25
    看楼上一些回答,真到了自己需要用的时候,也不会考虑他人的隐私
        13
    xxx749   44 天前   ♥ 1
    打开你头像的网站,关键词「 Chinese 」。不仅能合法爬到中国人脸还能顺带训练一波鉴黄模型
        14
    wangfei324017   44 天前 via iPhone
    微博,商汤科技
        15
    venster   44 天前 via Android
    可以参考一下 Facebook 最初是咋来的
        16
    upczww   44 天前 via iPhone
    @aneureka 感谢
        17
    Rgwang   44 天前 via Android
    现在都有美颜,除了身份系统都不真实
        18
    Raynard   44 天前
    给你提供个骚操作,

    网上有卖别人丢的 SFZ 的。。。

    会给你一个网盘链接让你挑。。。
        19
    zhangzhe532   44 天前 via iPhone   ♥ 1
    认真的吗?请问楼上出招的各位,是不把照片当隐私还是不把别人的照片当隐私?
    昨天才看到谷歌花钱采集流浪汉照片,到这都是爬别人提交的?
    https://m.baidu.com/sf_baijiahao/s?id=1646347330263271573&wfr=spider&for=pc
        20
    dream7758522   44 天前 via Android
    百元大钞
        21
    jhdxr   44 天前
    违法的手段上面说了一大堆了。其实不少数据公司也都有买(同样没有合理说明途径)

    最近严打隐私,这种东西不能合理说明来源的基本上就进去呆着吧
        22
    xmoiduts   44 天前 via Android
    欧洲都不让用真人脸做训练了……为什么都是欧美人脸😂
        23
    Nathanzheng   44 天前
    就这还天天说别人大厂不尊重隐私,自己就干这勾当、、、
        24
    iPhoneXI   44 天前 via Android
    高校教务系统
    一堆漏洞
        25
    gam2046   44 天前
    @Nathanzheng
    @zhangzhe532
    @chenchangjv

    大佬们,如果是在微博这样的互联网公开领域,抓取用户公开的自拍等,如果不考虑与新浪等运营方的 TOS,单纯就抓取者与信息发布者之间,是否有可能存在侵权关系呢?
        26
    douglas1997   44 天前
    自己用一个人脸检测识别算法扣吧。。
        27
    Nathanzheng   44 天前
    @gam2046 爬自拍不知道违法不违法不知道,但是爬别人系统偷人脸不道义是肯定的
        28
    yangxin0   44 天前 via iPhone
    爬别人的分分钟让你吃牢饭。
        29
    zjsrucsj   44 天前 via Android
    百合网,基本上头像都能过人脸算法,当初爬了几百万
        30
    wdlth   44 天前
    黑入天网……
        31
    rayhy   44 天前
    爬虫入刑的新闻有听说吗?收集数据前楼主最好确认下合规不合规。
        32
    houlin   42 天前 via Android   ♥ 1
    谈隐私的时候头头是道,爬隐私的时候也是头头是道
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1052 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 29ms · UTC 18:24 · PVG 02:24 · LAX 10:24 · JFK 13:24
    ♥ Do have faith in what you're doing.