如果想在 V2EX 获得更好的推广效果,欢迎了解 PRO 会员机制:
https://www.v2ex.com/pro/about

如果你经常使用铜币置顶主题,持有 V2EX Solana Token 会在每日签到时获得额外铜币:
https://www.v2ex.com/solana
Parry
V2EX  ›  推广

PDF 解析格式化输出 API 数据接口

  •  
  •   Parry ·
    PRO
    · Dec 3, 2024 · 1276 views
    This topic created in 550 days ago, the information mentioned may be changed or developed.

    PDF 解析格式化输出 API 数据接口

    支持输出 TEXT HTML XML TAG ,多种格式输出,超精准识别率。

    gugudata_api_cover

    1. 产品功能

    • 通用的识别接口, 支持标准 PDF 文件解析;
    • 多种格式输出,支持 TEXT HTML XML TAG ;
    • HTML 包含完美排版格式;
    • 基于机器学习不断提高的识别率;
    • 1M 文件毫秒级识别性能;
    • 数据持续更新与维护;
    • 全接口支持 HTTPS ( TLS v1.0 / v1.1 / v1.2 / v1.3 );
    • 全面兼容 Apple ATS ;
    • 全国多节点 CDN 部署;
    • 接口极速响应,多台服务器构建 API 接口负载均衡;
    • 接口调用状态与状态监控

    2. API 文档

    接口详情: https://www.gugudata.com/api/details/pdf2format

    接口地址: https://api.gugudata.com/imagerecognition/pdf2format?appkey={{appkey}}&type={{type}}

    返回格式: application/json; charset=utf-8

    请求方式: POST

    请求协议: HTTPS

    请求示例: https://api.gugudata.com/imagerecognition/pdf2format?appkey={{appkey}}&type={{type}}

    数据预览: https://www.gugudata.com/preview/pdf2format

    接口测试: https://api.gugudata.com/imagerecognition/pdf2format/demo

    3. 请求参数

    参数名 参数类型 是否必须 默认值 备注
    appkey string YOUR_APPKEY 付费后获取的 APPKEY
    type string YOUR_VALUE 定义输出格式,可选 text|html|xml|tag
    pdffile file YOUR_VALUE 文件格式参数,待转换的 PDF 文件

    4. 返回参数

    参数名 参数类型 备注
    DataStatus.StatusCode int 接口返回状态码
    DataStatus.StatusDescription string 接口返回状态说明
    DataStatus.ResponseDateTime string 接口数据返回时间
    DataStatus.DataTotalCount int 此条件下的总数据量,一般用于分页计算
    Data.Data string 接口解析 PDF 返回数据,格式由 type 参数决定
    3 replies    2024-12-03 11:25:49 +08:00
    mumbler
        1
    mumbler  
       Dec 3, 2024
    能不能输出 markdown
    IvanLi127
        2
    IvanLi127  
       Dec 3, 2024
    带 ocr 么?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1577 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 55ms · UTC 16:38 · PVG 00:38 · LAX 09:38 · JFK 12:38
    ♥ Do have faith in what you're doing.