8e713be1ca
Merge remote changes with RAG service optimization
...
- Keep user's RAG service integration for faster extraction
- Add remote's word_ai_service support
- Preserve user's parallel extraction and field header optimizations
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com >
2026-04-14 17:25:13 +08:00
a9dc0d8b91
优化智能填表功能:提升速度、完善数据提取精度
...
后端优化 (template_fill_service.py):
1. 速度优化:
- 使用 asyncio.gather 实现字段并行提取
- 跳过 AI 审核步骤,减少 LLM 调用次数
- 新增 _extract_single_field_fast 方法
2. 数据提取优化:
- 集成 RAG 服务进行智能内容检索
- 修复 Markdown 表格列匹配跳过空列
- 修复年份子表头行误识别问题
3. AI 表头生成优化:
- 精简为 5-7 个代表性字段(原来 8-15 个)
- 过滤非数据字段(source、备注、说明等)
- 简化字段名,如"医院数量"而非"医院-公立医院数量"
4. AI 数据提取 prompt 优化:
- 严格按表头提取,只返回相关数据
- 每个值必须带标注(年份/地区/分类)
- 支持多种标注类型:2024年、北京、某省、公立医院、三级医院等
- 保留原始数值、单位和百分号格式
- 不返回大段来源说明
5. FillResult 新增 warning 字段:
- 多值检测提示,如"检测到 2 个值"
前端优化 (TemplateFill.tsx):
- 填写详情显示多值警告(黄色提示框)
- 多值情况下直接显示所有值
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com >
2026-04-14 17:14:59 +08:00
5b82d40be0
Merge branch 'main' of https://gitea.kronecker.cc/OurCodesAreAllRight/FilesReadSystem
2026-04-10 10:10:41 +08:00
bedf1af9c0
增强 Word 文档 AI 解析和模板填充功能
2026-04-10 09:48:57 +08:00
858b594171
添加任务状态双写机制和历史记录功能
...
- 实现任务状态同时写入Redis和MongoDB的双写机制
- 添加MongoDB任务集合及CRUD操作接口
- 新增任务历史记录查询、列表展示和删除功能
- 重构任务状态更新逻辑,统一使用update_task_status函数
- 添加模板填服务中AI审核字段值的功能
- 优化前端任务历史页面显示和交互体验
2026-04-10 01:15:53 +08:00
c122f1d63b
完善后端日志
2026-03-30 21:24:13 +08:00
6b88e971e8
后端完成异步和rag设置
2026-03-26 23:41:03 +08:00
4bdc3f9707
完成后端数据库连接配置
2026-03-26 19:49:40 +08:00