|
|
e5d4724e82
|
【智能助手增强】
- 新增对话历史管理:MongoDB新增conversations集合,存储用户与AI的对话上下文,支持多轮对话意图延续
- 新增对话历史API(conversation.py):GET/DELETE conversation历史、列出所有会话
- 意图解析增强:支持基于对话历史的意图识别,上下文理解更准确
- 字段提取优化:支持"提取文档中的医院数量"等自然语言模式,智能去除"文档中的"前缀
- 文档对比优化:从指令中提取文件名并精确匹配source_docs,支持"对比A和B两个文档"
- 文档摘要优化:使用LLM生成真实AI摘要而非返回原始文档预览
【Word模板填表核心功能】
- Word模板字段生成:空白Word上传后,自动从源文档(Excel/Word/TXT/MD)内容AI生成字段名
- Word模板填表(_fill_docx):将提取数据写入Word模板表格,支持精确匹配、模糊匹配、追加新行
- 数据润色(_polish_word_filled_data):LLM对多行Excel数据进行统计归纳(合计/平均/极值),转化为专业自然语言描述
- 段落格式输出:使用📌字段名+值段落+分隔线(灰色横线)格式,提升可读性
- 导出链打通:fill_template返回filled_file_path,export直接返回已填好的Word文件
【其他修复】
- 修复Word导出Windows文件锁问题:NamedTemporaryFile改为mkstemp+close
- 修复Word方框非法字符:扩展clean_text移除\uFFFD、□等Unicode替代符和零宽字符
- 修复文档对比"需要至少2个文档":从指令提取具体文件名优先匹配而非取前2个
- 修复导出format硬编码:自动识别docx/xlsx格式
- Docx解析器增加备用解析方法和更完整的段落/表格/标题提取
- RAG服务新增MySQL数据源支持
|
2026-04-15 23:32:55 +08:00 |
|
|
|
ecad9ccd82
|
feat: 实现智能指令的格式转换和文档编辑功能
主要更新:
- 新增 transform 意图:支持 Word/Excel/Markdown 格式互转
- 新增 edit 意图:使用 LLM 润色编辑文档内容
- 智能指令接口增加异步执行模式(async_execute 参数)
- 修复 Word 模板导出文档损坏问题(改用临时文件方式)
- 优化 intent_parser 增加 transform/edit 关键词识别
新增文件:
- app/api/endpoints/instruction.py: 智能指令 API 端点
- app/services/multi_doc_reasoning_service.py: 多文档推理服务
其他优化:
- RAG 服务混合搜索(BM25 + 向量)融合
- 模板填充服务表头匹配增强
- Word AI 解析服务返回结构完善
- 前端 InstructionChat 组件对接真实 API
|
2026-04-14 20:39:37 +08:00 |
|
|
|
a9dc0d8b91
|
优化智能填表功能:提升速度、完善数据提取精度
后端优化 (template_fill_service.py):
1. 速度优化:
- 使用 asyncio.gather 实现字段并行提取
- 跳过 AI 审核步骤,减少 LLM 调用次数
- 新增 _extract_single_field_fast 方法
2. 数据提取优化:
- 集成 RAG 服务进行智能内容检索
- 修复 Markdown 表格列匹配跳过空列
- 修复年份子表头行误识别问题
3. AI 表头生成优化:
- 精简为 5-7 个代表性字段(原来 8-15 个)
- 过滤非数据字段(source、备注、说明等)
- 简化字段名,如"医院数量"而非"医院-公立医院数量"
4. AI 数据提取 prompt 优化:
- 严格按表头提取,只返回相关数据
- 每个值必须带标注(年份/地区/分类)
- 支持多种标注类型:2024年、北京、某省、公立医院、三级医院等
- 保留原始数值、单位和百分号格式
- 不返回大段来源说明
5. FillResult 新增 warning 字段:
- 多值检测提示,如"检测到 2 个值"
前端优化 (TemplateFill.tsx):
- 填写详情显示多值警告(黄色提示框)
- 多值情况下直接显示所有值
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
|
2026-04-14 17:14:59 +08:00 |
|
|
|
44d389a434
|
临时禁用RAG服务并添加日志记录
- 在RAGService中添加_disabled标志,临时禁用所有RAG功能
- 添加详细的日志记录,便于调试和监控被跳过的操作
- 在TableRAGService中同样添加禁用机制,避免索引构建
refactor(file): 更新.gitignore忽略日志目录
- 添加**/logs/到.gitignore文件中
docs(plan): 添加比赛备赛规划文档
- 创建完整的比赛备赛规划文档,包含功能清单和待办事项
- 记录已完成功能和核心缺失模块,便于项目跟踪
chore(excel): 添加Q&A参考文件
- 添加Q&A.xlsx作为参考文档,包含比赛相关问题解答
|
2026-04-08 19:59:41 +08:00 |
|
|
|
ec4759512d
|
```
feat(database): 为MySQL服务添加text函数导入支持
添加了SQLAlchemy的text函数导入,用于支持原始SQL查询操作,
增强数据库交互的灵活性和兼容性。
---
feat(excel): 改进Excel存储服务的列名处理机制
优化了列名清理逻辑,支持UTF8编码包括中文字符,实现唯一列名
生成机制,防止列名冲突。同时切换到pymysql直接插入方式,
提升批量数据插入性能并解决SQLAlchemy异步问题。
---
fix(rag): 改进RAG服务嵌入模型加载策略
当嵌入模型加载失败时,采用更稳健的降级策略,使用简化模式
运行RAG服务而非完全失败,确保系统核心功能可用性。
```
|
2026-04-02 03:39:00 +08:00 |
|
|
|
8e1ddb8aff
|
```
feat(config): 添加RAG/Embedding配置选项
- 新增EMBEDDING_MODEL配置项,默认值为"all-MiniLM-L6-v2"
- 用于支持RAG服务的嵌入模型配置
feat(database): 增强MySQL数据库初始化功能
- 实现数据库自动创建功能,若数据库不存在则自动创建
- 使用临时连接在不指定数据库的情况下执行CREATE DATABASE语句
- 支持utf8mb4字符集和排序规则设置
refactor(excel): 优化Excel表创建逻辑
- 将表创建方式从ORM模型改为原生SQL语句
- 提高异步操作的兼容性
- 增加自动时间戳字段(created_at, updated_at)
feat(rag): 增强RAG服务嵌入模型错误处理
- 添加嵌入模型加载异常处理机制
- 当配置的模型加载失败时自动回退到默认模型
- 改进日志记录,提供更详细的初始化信息
```
|
2026-04-02 02:42:03 +08:00 |
|
|
|
7c88da9ab1
|
完善数据库调用
|
2026-03-27 00:06:17 +08:00 |
|
|
|
4bdc3f9707
|
完成后端数据库连接配置
|
2026-03-26 19:49:40 +08:00 |
|