V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
bitinn
V2EX  ›  Node.js

doc-sniff,解决请求返回不正确 content-type 的 node.js 库

  •  
  •   bitinn · 2015-01-30 04:52:40 +08:00 · 2034 次点击
    这是一个创建于 3372 天前的主题,其中的信息可能已经有所发展或是发生改变。

    专职分辨日常抓取的html/xml,因为不方便用后缀名和magic number猜;现实简化的whatwg mimesniff spec算法。

    不过这个算法到底有多准我还不确定,欢迎大家找实际案例帮忙测试。这种代码应该是很常写的,但是大家遇到的变态页面情况都不同,希望通过协作找到适合99.99%案例的算法。

    https://github.com/bitinn/doc-sniff

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   981 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 21:38 · PVG 05:38 · LAX 14:38 · JFK 17:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.