對接內部系統指南
PDFValid 準文 採用「命令行優先」設計,提供多種輸入輸出方式,便於與企業現有系統、工作流和 AI 應用打通。
集成方式概覽
| 方式 | 適用場景 | 說明 |
|---|---|---|
| CLI 命令行 | 腳本、CI/CD、RPA、定時任務 | 通過 pdf-toolkit 命令觸發掃描、處理、導出 |
| Excel 清單 | 批量任務管理 | 通過 Excel 導入待處理文件清單,處理後再回寫結果 |
| 本地目錄 | 掃描服務中心、文件伺服器 | 直接監聽或批量處理某個目錄下的 PDF |
| SQLite / Excel 報告 | 內部系統讀取 | 處理結果寫入數據庫或 Excel,供 ECM/DMS/BI 系統消費 |
| HTML 報告 | 人工覆核、審計展示 | 生成可視化報告,便於質檢與合規檢查 |
常見對接系統
1. ECM / DMS(企業內容 / 文件管理系統)
- PDFValid 準文 將文件標準化後,輸出統一命名、統一目錄結構的結果。
- 通過 Excel 或 SQLite 報告回寫文件 ID、處理狀態、異常類型,便於 ECM/DMS 做歸檔分類與版本管理。
2. RPA(機械人流程自動化)
- RPA 機械人可定時調用
pdf-toolkit run或pdf-toolkit process。 - 處理完成後讀取 Excel 報告,自動將正常文件與待修復文件分發到不同目錄或流程節點。
3. 檔案管理系統
- 將歷史保單、合約、檔案目錄批量導入 PDFValid 準文。
- 輸出 A4 標準化、顏色修復、可搜尋的 PDF,並生成逐頁審計明細,滿足檔案長期保存與監管檢查要求。
4. 知識庫 / 大模型平台
- 標準化後的 PDF 頁面統一、顏色正常、文字可選,降低大模型解析噪音。
- 配合 OCR 能力,掃描件也能生成可搜尋、可複製文字層的 PDF,方便向量化入庫與智能問答。
5. 藥監 / 審計平台
- 生成逐頁處理明細 Excel,包含每頁顏色空間、修復記錄、完整性校驗結果。
- 可直接作為藥監檢查、內部審計、合規自查的交付物。
典型調用示例
# 掃描 + 處理 + 導出 Excel 報告
pdf-toolkit run --export-excel result.xlsx
# 僅處理本地目錄
pdf-toolkit process -i ./pdfs/ -o ./output/
# 導出報告供內部系統讀取
pdf-toolkit export -o report.xlsx
定制集成
如果企業內部系統有特殊的接口協議、目錄結構、欄位映射或審批流程,可選購定制版服務,由 PDFValid 準文 技術團隊提供專屬對接開發與技術支援。