Files
FilesReadSystem/backend/requirements.txt
dj e5d4724e82 【智能助手增强】
- 新增对话历史管理:MongoDB新增conversations集合,存储用户与AI的对话上下文,支持多轮对话意图延续
- 新增对话历史API(conversation.py):GET/DELETE conversation历史、列出所有会话
- 意图解析增强:支持基于对话历史的意图识别,上下文理解更准确
- 字段提取优化:支持"提取文档中的医院数量"等自然语言模式,智能去除"文档中的"前缀
- 文档对比优化:从指令中提取文件名并精确匹配source_docs,支持"对比A和B两个文档"
- 文档摘要优化:使用LLM生成真实AI摘要而非返回原始文档预览

【Word模板填表核心功能】
- Word模板字段生成:空白Word上传后,自动从源文档(Excel/Word/TXT/MD)内容AI生成字段名
- Word模板填表(_fill_docx):将提取数据写入Word模板表格,支持精确匹配、模糊匹配、追加新行
- 数据润色(_polish_word_filled_data):LLM对多行Excel数据进行统计归纳(合计/平均/极值),转化为专业自然语言描述
- 段落格式输出:使用📌字段名+值段落+分隔线(灰色横线)格式,提升可读性
- 导出链打通:fill_template返回filled_file_path,export直接返回已填好的Word文件

【其他修复】
- 修复Word导出Windows文件锁问题:NamedTemporaryFile改为mkstemp+close
- 修复Word方框非法字符:扩展clean_text移除\uFFFD、□等Unicode替代符和零宽字符
- 修复文档对比"需要至少2个文档":从指令提取具体文件名优先匹配而非取前2个
- 修复导出format硬编码:自动识别docx/xlsx格式
- Docx解析器增加备用解析方法和更完整的段落/表格/标题提取
- RAG服务新增MySQL数据源支持
2026-04-15 23:32:55 +08:00

57 lines
1.5 KiB
Plaintext

# ============================================================
# 基于大语言模型的文档理解与多源数据融合系统
# Python 依赖清单
# ============================================================
# ==================== Web 框架 ====================
fastapi[all]==0.104.1
uvicorn[standard]==0.24.0
python-multipart==0.0.6
# ==================== 数据验证与配置 ====================
pydantic==2.5.0
pydantic-settings==2.1.0
python-dotenv==1.0.0
# ==================== 数据库 - MySQL (结构化数据) ====================
pymysql==1.1.0
aiomysql==0.2.0
sqlalchemy==2.0.25
# ==================== 数据库 - MongoDB (非结构化数据) ====================
motor==3.3.2
pymongo==4.5.0
# ==================== 数据库 - Redis (缓存/队列) ====================
redis==5.0.0
# ==================== 异步任务 ====================
celery==5.3.4
# ==================== RAG / 向量数据库 ====================
# chromadb==0.4.22 # Windows 需要 C++ 编译环境,如需安装请使用预编译版本或 WSL
sentence-transformers==2.7.0
faiss-cpu==1.8.0
# ==================== 文档解析 ====================
pandas==2.1.4
openpyxl==3.1.2
python-docx==0.8.11
markdown-it-py==3.0.0
chardet==5.2.0
Pillow>=10.0.0
pytesseract>=0.3.10
# ==================== AI / LLM ====================
httpx==0.25.2
# ==================== 数据处理与可视化 ====================
matplotlib==3.8.2
numpy==1.26.2
# ==================== 工具库 ====================
requests==2.31.0
loguru==0.7.2
tqdm==4.66.1
PyYAML==6.0.1