训练侧采用主流分布式框架与参数高效微调(LoRA / 适配器)组合策略;推理侧按场景拆分:批处理文档走离线队列,在线对话走限流与缓存。输出侧统一 JSON Schema 校验,失败自动重试与降级模板。
文本、矢量图元、栅格图与表格在同一项目空间内建立弱监督对齐;跨页引用通过图框 ID 与版面树维护,避免「看似正确」的跨文档串扰。
视觉模型支持 ONNX / TensorRT 导出;边缘盒与中心之间仅同步指标与样本指纹,原始图像默认不出厂界。
私有化知识库可完全离线;若必须调用公网大模型,提供字段脱敏与可配置「零外发」模式(由本地小模型兜底)。