V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
mornlight
V2EX  ›  问与答

所以说到底,百度还是不支持 https 站点收录的

  •  
  •   mornlight · 2014-10-01 17:39:02 +08:00 · 11431 次点击
    这是一个创建于 3707 天前的主题,其中的信息可能已经有所发展或是发生改变。
    刚才看到百度站长平台官网上的一篇文章,讲了https站点如何对百度搜索引擎友好。开头他就说不会主动收录https站点。
    http://zhanzhang.baidu.com/wiki/321

    关于百度收录https的问题,前些日子v2里有人讨论过,不少人觉得是会收录的因为他看到有https站点能在百度搜索到。
    百度告诉你:小站我才不管,想收录?为需要被百度搜索引擎收录的https页面制作http可访问版

    Google不仅收录https,而且更喜欢https。在这点上,百度落后一大截。

    顺带提供一下Nginx配置文件里,对80端口监听时对非百度爬虫进行https重写的设置:

    if ($http_user_agent !~* Baidu)
    {
    rewrite ^(.*)$ https://www.test.com $1 permanent;
    }

    第一次知道百度不收录https还是在@tumutanzi 的博客里,感谢
    17 条回复    2015-06-08 16:16:37 +08:00
    tumutanzi
        1
    tumutanzi  
       2014-10-01 17:47:15 +08:00
    我很好奇的是,为什么百度不收录HTTPS?而国内搜索引擎包括360搜索等,都收录HTTPS,我想肯定不是技术方面的原因。
    tumutanzi
        2
    tumutanzi  
       2014-10-01 17:48:06 +08:00
    @tumutanzi Refer to 搜索引擎是否收录HTTPS SSL网站? https://tumutanzi.com/archives/12689
    clippit
        3
    clippit  
       2014-10-01 19:37:47 +08:00   ❤️ 1
    连百度本身都已经支持 HTTPS 了: https://www.baidu.com/s?wd=v2ex
    但是不知道为什么不收录 HTTPS。。
    jasontse
        4
    jasontse  
       2014-10-01 19:46:23 +08:00 via iPad   ❤️ 1
    @clippit
    1. 国内环境不喜欢加密。
    2. 爬虫服务器压力较大。
    tumutanzi
        5
    tumutanzi  
       2014-10-01 20:04:14 +08:00
    mornlight
        6
    mornlight  
    OP
       2014-10-01 20:31:14 +08:00
    @jasontse 作为专业的搜索引擎,提供完善的功能应该是本身义务所在,不能说国内环境https不多所以就不想去收录。
    服务器压力...你觉得这是百度会担心的问题吗
    damajia
        7
    damajia  
       2014-10-01 20:37:31 +08:00
    百度确实不收录https网站,我一个网站,原来没用https,百度收录很多文章,后来加了ssl,百度全部给我干掉了,现在连首页都没有了。
    不过自从Google宣布鼓励https后,网站流量增加了近3成,搜索排名也靠前了。
    幸亏是几乎都是外国人访问,百度不收录就不收录吧,哈哈
    mornlight
        8
    mornlight  
    OP
       2014-10-01 20:41:01 +08:00
    @damajia 对于用户大部分是国外的站点来说,百度的结果的确不是很重要。不过如果是国内环境,面向国内用户的话还是不得不考虑一下。
    百度不收录https 往大了说是在阻碍中国互联网环境的进步。
    wwqgtxx
        9
    wwqgtxx  
       2014-10-01 20:41:30 +08:00 via Android
    @clippit 2014年6月签发的证书,好新
    jasontse
        10
    jasontse  
       2014-10-01 20:52:42 +08:00 via Android
    @mornlight
    能省一点是一点,没有商人不抠门的。
    binux
        11
    binux  
       2014-10-01 20:57:37 +08:00 via Android
    人工配置一下是支持
    希望年内新抓取器能全流量上线吧,到时连js也zhi'chi
    xoxo
        12
    xoxo  
       2014-10-01 21:50:56 +08:00   ❤️ 1
    能使用https的平台
    有那气魄禁止被百度收录才是(主站被百度收录就行)
    rankjie
        13
    rankjie  
       2014-10-02 01:10:33 +08:00 via iPhone
    pandafan.org 从来没用过百度更别说主动去申请索引了,怎么就被收录了呢?
    ericls
        14
    ericls  
       2014-10-02 02:01:13 +08:00 via Android
    ajax更蛋疼
    tumutanzi
        15
    tumutanzi  
       2015-03-25 19:57:27 +08:00
    @rankjie 没有找到该URL。您可以直接访问 https://pandafan.org,还可提交网址给我们。
    以下是网页中包含"https://pandafan.org"的结果:
    rankjie
        16
    rankjie  
       2015-03-25 21:33:08 +08:00 via iPhone
    搜索“熊猫翻滚” 结果就是https的链接
    mornlight
        17
    mornlight  
    OP
       2015-06-08 16:16:37 +08:00
    update:百度正式开放 https 站点收录 /t/193654
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5539 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 09:27 · PVG 17:27 · LAX 01:27 · JFK 04:27
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.