对接内部系统指南
PDFValid 准文 采用“命令行优先”设计,提供多种输入输出方式,便于与企业现有系统、工作流和 AI 应用打通。
集成方式概览
| 方式 | 适用场景 | 说明 |
|---|---|---|
| CLI 命令行 | 脚本、CI/CD、RPA、定时任务 | 通过 pdf-toolkit 命令触发扫描、处理、导出 |
| Excel 清单 | 批量任务管理 | 通过 Excel 导入待处理文件清单,处理后再回写结果 |
| 本地目录 | 扫描服务中心、文件服务器 | 直接监听或批量处理某个目录下的 PDF |
| SQLite / Excel 报告 | 内部系统读取 | 处理结果写入数据库或 Excel,供 ECM/DMS/BI 系统消费 |
| HTML 报告 | 人工复核、审计展示 | 生成可视化报告,便于质检与合规检查 |
常见对接系统
1. ECM / DMS(企业内容 / 文档管理系统)
- PDFValid 准文 将文件标准化后,输出统一命名、统一目录结构的结果。
- 通过 Excel 或 SQLite 报告回写文件 ID、处理状态、异常类型,便于 ECM/DMS 做归档分类与版本管理。
2. RPA(机器人流程自动化)
- RPA 机器人可定时调用
pdf-toolkit run或pdf-toolkit process。 - 处理完成后读取 Excel 报告,自动将正常文件与待修复文件分发到不同目录或流程节点。
3. 档案管理系统
- 将历史保单、合同、档案目录批量导入 PDFValid 准文。
- 输出 A4 标准化、颜色修复、可搜索的 PDF,并生成逐页审计明细,满足档案长期保存与监管检查要求。
4. 知识库 / 大模型平台
- 标准化后的 PDF 页面统一、颜色正常、文字可选,降低大模型解析噪音。
- 配合 OCR 能力,扫描件也能生成可搜索、可复制文字层的 PDF,方便向量化入库与智能问答。
5. 药监 / 审计平台
- 生成逐页处理明细 Excel,包含每页颜色空间、修复记录、完整性校验结果。
- 可直接作为药监检查、内部审计、合规自查的交付物。
典型调用示例
# 扫描 + 处理 + 导出 Excel 报告
pdf-toolkit run --export-excel result.xlsx
# 仅处理本地目录
pdf-toolkit process -i ./pdfs/ -o ./output/
# 导出报告供内部系统读取
pdf-toolkit export -o report.xlsx
定制集成
如果企业内部系统有特殊的接口协议、目录结构、字段映射或审批流程,可选购定制版服务,由 PDFValid 准文 技术团队提供专属对接开发与技术支持。