|
|
ecad9ccd82
|
feat: 实现智能指令的格式转换和文档编辑功能
主要更新:
- 新增 transform 意图:支持 Word/Excel/Markdown 格式互转
- 新增 edit 意图:使用 LLM 润色编辑文档内容
- 智能指令接口增加异步执行模式(async_execute 参数)
- 修复 Word 模板导出文档损坏问题(改用临时文件方式)
- 优化 intent_parser 增加 transform/edit 关键词识别
新增文件:
- app/api/endpoints/instruction.py: 智能指令 API 端点
- app/services/multi_doc_reasoning_service.py: 多文档推理服务
其他优化:
- RAG 服务混合搜索(BM25 + 向量)融合
- 模板填充服务表头匹配增强
- Word AI 解析服务返回结构完善
- 前端 InstructionChat 组件对接真实 API
|
2026-04-14 20:39:37 +08:00 |
|
|
|
a9dc0d8b91
|
优化智能填表功能:提升速度、完善数据提取精度
后端优化 (template_fill_service.py):
1. 速度优化:
- 使用 asyncio.gather 实现字段并行提取
- 跳过 AI 审核步骤,减少 LLM 调用次数
- 新增 _extract_single_field_fast 方法
2. 数据提取优化:
- 集成 RAG 服务进行智能内容检索
- 修复 Markdown 表格列匹配跳过空列
- 修复年份子表头行误识别问题
3. AI 表头生成优化:
- 精简为 5-7 个代表性字段(原来 8-15 个)
- 过滤非数据字段(source、备注、说明等)
- 简化字段名,如"医院数量"而非"医院-公立医院数量"
4. AI 数据提取 prompt 优化:
- 严格按表头提取,只返回相关数据
- 每个值必须带标注(年份/地区/分类)
- 支持多种标注类型:2024年、北京、某省、公立医院、三级医院等
- 保留原始数值、单位和百分号格式
- 不返回大段来源说明
5. FillResult 新增 warning 字段:
- 多值检测提示,如"检测到 2 个值"
前端优化 (TemplateFill.tsx):
- 填写详情显示多值警告(黄色提示框)
- 多值情况下直接显示所有值
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
|
2026-04-14 17:14:59 +08:00 |
|
|
|
44d389a434
|
临时禁用RAG服务并添加日志记录
- 在RAGService中添加_disabled标志,临时禁用所有RAG功能
- 添加详细的日志记录,便于调试和监控被跳过的操作
- 在TableRAGService中同样添加禁用机制,避免索引构建
refactor(file): 更新.gitignore忽略日志目录
- 添加**/logs/到.gitignore文件中
docs(plan): 添加比赛备赛规划文档
- 创建完整的比赛备赛规划文档,包含功能清单和待办事项
- 记录已完成功能和核心缺失模块,便于项目跟踪
chore(excel): 添加Q&A参考文件
- 添加Q&A.xlsx作为参考文档,包含比赛相关问题解答
|
2026-04-08 19:59:41 +08:00 |
|
|
|
ec4759512d
|
```
feat(database): 为MySQL服务添加text函数导入支持
添加了SQLAlchemy的text函数导入,用于支持原始SQL查询操作,
增强数据库交互的灵活性和兼容性。
---
feat(excel): 改进Excel存储服务的列名处理机制
优化了列名清理逻辑,支持UTF8编码包括中文字符,实现唯一列名
生成机制,防止列名冲突。同时切换到pymysql直接插入方式,
提升批量数据插入性能并解决SQLAlchemy异步问题。
---
fix(rag): 改进RAG服务嵌入模型加载策略
当嵌入模型加载失败时,采用更稳健的降级策略,使用简化模式
运行RAG服务而非完全失败,确保系统核心功能可用性。
```
|
2026-04-02 03:39:00 +08:00 |
|
|
|
8e1ddb8aff
|
```
feat(config): 添加RAG/Embedding配置选项
- 新增EMBEDDING_MODEL配置项,默认值为"all-MiniLM-L6-v2"
- 用于支持RAG服务的嵌入模型配置
feat(database): 增强MySQL数据库初始化功能
- 实现数据库自动创建功能,若数据库不存在则自动创建
- 使用临时连接在不指定数据库的情况下执行CREATE DATABASE语句
- 支持utf8mb4字符集和排序规则设置
refactor(excel): 优化Excel表创建逻辑
- 将表创建方式从ORM模型改为原生SQL语句
- 提高异步操作的兼容性
- 增加自动时间戳字段(created_at, updated_at)
feat(rag): 增强RAG服务嵌入模型错误处理
- 添加嵌入模型加载异常处理机制
- 当配置的模型加载失败时自动回退到默认模型
- 改进日志记录,提供更详细的初始化信息
```
|
2026-04-02 02:42:03 +08:00 |
|
|
|
7c88da9ab1
|
完善数据库调用
|
2026-03-27 00:06:17 +08:00 |
|
|
|
4bdc3f9707
|
完成后端数据库连接配置
|
2026-03-26 19:49:40 +08:00 |
|