feat(layout): 更新应用名称为表易智融

- 将MainLayout组件中的应用名称从"智联文档"更新为"表易智融" - 更新侧边栏标题显示新的应用名称 - 统一所有相关界面的文字标识 fix(assistant): 同步更新AI助手介绍文本 - 更新Assistant页面中AI助手的自我介绍内容 - 将欢迎消息中的应用名称替换为"表易智融" docs(dashboard): 更新欢迎页面应用名称 - 修改Dashboard页面欢迎消息中的应用名称展示 - 确保用户界面的一致性体验 refactor(instruction-chat): 更新指令聊天页面助手名称 - 同步更新InstructionChat页面中AI助手的介绍文本 - 保持整个应用中品牌名称的统一性
更新LLM配置并改进文件路径管理
2026-05-05 15:02:45 +08:00 · 2026-04-21 21:20:14 +08:00 · 2026-04-21 20:48:18 +08:00 · 2026-04-21 20:47:28 +08:00 · 2026-04-21 20:39:12 +08:00 · 2026-04-20 00:00:30 +08:00
34 changed files with 2277 additions and 108 deletions
--- a/.claude/settings.local.json
+++ b/.claude/settings.local.json
@@ -0,0 +1,7 @@
+{
+  "permissions": {
+    "allow": [
+      "WebSearch"
+    ]
+  }
+}
--- a/.env.example
+++ b/.env.example
@@ -0,0 +1,35 @@
+# ============================================================
+# FilesReadSystem 环境变量配置模板
+# 复制此文件为 .env 并填入实际值
+# ============================================================
+
+# ==================== 应用配置 ====================
+DEBUG=false
+
+# ==================== MongoDB ====================
+MONGO_ROOT_USER=admin
+MONGO_ROOT_PASSWORD=your_mongo_password
+MONGODB_DB_NAME=document_system
+
+# ==================== MySQL ====================
+MYSQL_PASSWORD=your_mysql_password
+MYSQL_DATABASE=document
+
+# ==================== Redis ====================
+REDIS_PASSWORD=your_redis_password
+
+# ==================== LLM AI ====================
+LLM_API_KEY=your_llm_api_key
+LLM_BASE_URL=https://api.deepseek.com
+LLM_MODEL_NAME=deepseek-chat
+
+# ==================== Supabase ====================
+SUPABASE_URL=https://your-project.supabase.co
+SUPABASE_ANON_KEY=your_anon_key
+SUPABASE_SERVICE_KEY=your_service_key
+
+# ==================== Embedding / RAG ====================
+EMBEDDING_MODEL=all-MiniLM-L6-v2
+
+# ==================== 前端配置 ====================
+VITE_APP_ID=your_app_id
--- a/README.md
+++ b/README.md
@@ -1,4 +1,4 @@
-# FilesReadSystem
+# 智联文档

 ## 项目介绍 / Project Introduction

@@ -26,37 +26,79 @@ A document understanding and multi-source data fusion system based on Large Lang

 ## 项目架构 / Project Architecture

+```mermaid
+flowchart TB
+    subgraph UI["用户界面 / User Interface"]
+        Frontend["React + TypeScript + shadcn/ui"]
+    end
+
+    subgraph Backend["FastAPI 后端 / Backend"]
+        Upload["上传 API<br/>/upload"]
+        Documents["文档管理<br/>/documents"]
+        RAG["RAG 检索<br/>/rag/search"]
+        AI["AI 分析<br/>/ai/analyze"]
+        Template["模板填充<br/>/templates/fill"]
+        Instruction["自然语言指令<br/>/instruction/execute"]
+        Visual["可视化<br/>/visualization"]
+    end
+
+    subgraph Data["数据层 / Data Layer"]
+        MongoDB["MongoDB<br/>文档存储"]
+        MySQL["MySQL<br/>结构化数据"]
+        Redis["Redis<br/>缓存/队列"]
+        FAISS["FAISS<br/>向量索引"]
+    end
+
+    UI --> Backend
+    Backend --> MongoDB
+    Backend --> MySQL
+    Backend --> Redis
+    MongoDB --> FAISS
 ```
-┌─────────────────────────────────────────────────────────────────┐
-│                         User Interface                           │
-│              (React + TypeScript + shadcn/ui)                    │
-└─────────────────────────────────────────────────────────────────┘
-                                │
-                                ▼
-┌─────────────────────────────────────────────────────────────────┐
-│                      FastAPI Backend                             │
-│  ┌─────────────┐  ┌──────────────┐  ┌─────────────────────────┐ │
-│  │ Upload API  │  │ RAG Search   │  │ Natural Language       │ │
-│  │ /documents  │  │ /rag/search  │  │ /instruction/execute   │ │
-│  └─────────────┘  └──────────────┘  └─────────────────────────┘ │
-│  ┌─────────────┐  ┌──────────────┐  ┌─────────────────────────┐ │
-│  │ AI Analyze  │  │ Template Fill│  │ Visualization          │ │
-│  │ /ai/analyze │  │ /templates   │  │ /visualization         │ │
-│  └─────────────┘  └──────────────┘  └─────────────────────────┘ │
-└─────────────────────────────────────────────────────────────────┘
-                                │
-          ┌─────────────────────┼─────────────────────┐
-          ▼                     ▼                     ▼
-┌─────────────────┐   ┌─────────────────┐   ┌─────────────────┐
-│    MongoDB      │   │      MySQL      │   │      Redis      │
-│  (Documents)    │   │  (Structured)   │   │   (Cache/Queue) │
-└─────────────────┘   └─────────────────┘   └─────────────────┘
-          │
-          ▼
-┌─────────────────┐
-│     FAISS       │
-│ (Vector Index)  │
-└─────────────────┘
+
+---
+
+## 程序流程 / Program Flow
+
+```mermaid
+flowchart TD
+    Start([用户上传文档<br/>User Uploads Document]) --> Parse{解析文档格式<br/>Parse Document Format}
+
+    Parse -->|Excel| ParseXlsx["解析 Excel<br/>Parse XLSX"]
+    Parse -->|Word| ParseDocx["解析 Word<br/>Parse DOCX"]
+    Parse -->|Markdown| ParseMd["解析 Markdown<br/>Parse Markdown"]
+    Parse -->|Text| ParseTxt["解析文本<br/>Parse Text"]
+
+    ParseXlsx --> Store1[(存储到<br/>MongoDB)]
+    ParseDocx --> Store1
+    ParseMd --> Store1
+    ParseTxt --> Store1
+
+    Store1 --> Embed["Embedding 向量化<br/>Create Embeddings"]
+    Embed --> Index[(索引到<br/>FAISS)]
+
+    Index --> TaskCreated{创建任务<br/>Create Task}
+
+    TaskCreated -->|同步| ProcessSync["同步处理<br/>Sync Process"]
+    TaskCreated -->|异步| QueueTask["加入任务队列<br/>Queue to Celery"]
+
+    ProcessSync --> ReturnResult["返回结果<br/>Return Result"]
+
+    QueueTask --> CeleryWorker["Celery Worker<br/>异步处理"]
+    CeleryWorker --> LLM["调用 LLM<br/>Call LLM API"]
+    LLM --> StoreResult["存储结果<br/>Store Result"]
+    StoreResult --> ReturnAsync["返回任务ID<br/>Return Task ID"]
+
+    ReturnResult --> End([完成<br/>Complete])
+    ReturnAsync --> Poll{轮询任务状态<br/>Poll Task Status}
+    Poll -->|进行中| Poll
+    Poll -->|完成| GetResult["获取结果<br/>Get Result"]
+    GetResult --> End
+
+    style Start fill:#e1f5fe
+    style End fill:#c8e6c9
+    style LLM fill:#fff3e0
+    style CeleryWorker fill:#fff3e0
 ```

 ---
@@ -233,6 +275,77 @@ pnpm dev

 ---

+## Docker 部署 / Docker Deployment
+
+### 快速启动 / Quick Start
+
+```bash
+# 1. 复制环境变量模板并编辑
+cp .env.example .env
+# 编辑 .env 填入实际配置
+
+# 2. 启动所有服务
+docker compose up -d
+
+# 3. 查看日志
+docker compose logs -f
+
+# 4. 检查服务状态
+docker compose ps
+
+# 5. 更新部署
+docker compose up -d --build
+```
+
+### 服务说明 / Services
+
+| 服务 | 端口 | 说明 |
+|:---|:---|:---|
+| frontend | 80 | React 前端 (Nginx) |
+| backend | 8000 | FastAPI 后端 |
+| mongodb | 27017 | MongoDB 数据库 |
+| mysql | 3306 | MySQL 数据库 |
+| redis | 6379 | Redis 缓存/队列 |
+
+### 环境变量 / Environment Variables
+
+创建 `.env` 文件，参考 `.env.example`:
+
+```bash
+# 数据库配置
+MONGO_ROOT_USER=admin
+MONGO_ROOT_PASSWORD=your_password
+MONGODB_DB_NAME=document_system
+MYSQL_PASSWORD=your_password
+MYSQL_DATABASE=document
+REDIS_PASSWORD=your_password
+
+# LLM 配置
+LLM_API_KEY=your_api_key
+LLM_BASE_URL=https://api.deepseek.com
+LLM_MODEL_NAME=deepseek-chat
+
+# Supabase 配置
+SUPABASE_URL=https://your-project.supabase.co
+SUPABASE_ANON_KEY=your_anon_key
+SUPABASE_SERVICE_KEY=your_service_key
+```
+
+### 验证部署 / Verify Deployment
+
+```bash
+# 检查所有服务状态
+docker compose ps
+
+# 访问前端
+curl http://localhost
+
+# 检查后端健康
+curl http://localhost:8000/health
+```
+
+---
+
 ## 许可证 / License

 ISC
--- a/backend/.env.example
+++ b/backend/.env.example
@@ -34,9 +34,9 @@ REDIS_URL="redis://localhost:6379/0"
 #   - 模型: glm-4-flash (快速文本模型), glm-4 (标准), glm-4-plus (高性能)
 #   - API: https://open.bigmodel.cn
 #   - API Key: https://open.bigmodel.cn/usercenter/apikeys
-LLM_API_KEY="ca79ad9f96524cd5afc3e43ca97f347d.cpiLLx2oyitGvTeU"
-LLM_BASE_URL="https://open.bigmodel.cn/api/paas/v4"
-LLM_MODEL_NAME="glm-4v-plus"
+LLM_API_KEY="your_llm_api_key_here"
+LLM_BASE_URL="https://api.deepseek.com"
+LLM_MODEL_NAME="deepseek-chat"

 # ==================== Supabase 配置 ====================
 # Supabase 项目配置
@@ -45,10 +45,14 @@ SUPABASE_ANON_KEY="your_supabase_anon_key_here"
 SUPABASE_SERVICE_KEY="your_supabase_service_key_here"

 # ==================== 文件路径配置 ====================
-# 上传文件存储目录 (相对于项目根目录)
+# 上传文件存储目录
+# 本地开发: ./data/uploads
+# Docker部署: /app/data/uploads
 UPLOAD_DIR="./data/uploads"

-# Faiss 向量数据库持久化目录 (LangChain + Faiss 实现)
+# Faiss 向量数据库持久化目录
+# 本地开发: ./data/faiss
+# Docker部署: /app/data/faiss
 FAISS_INDEX_DIR="./data/faiss"

 # ==================== RAG 配置 ====================
--- a/backend/=4.0.0
+++ b/backend/=4.0.0
@@ -0,0 +1,7 @@
+Collecting reportlab
+  Using cached reportlab-4.4.10-py3-none-any.whl.metadata (1.7 kB)
+Requirement already satisfied: pillow>=9.0.0 in d:\code\filesreadsystem\backend\venv\lib\site-packages (from reportlab) (12.1.1)
+Requirement already satisfied: charset-normalizer in d:\code\filesreadsystem\backend\venv\lib\site-packages (from reportlab) (3.4.6)
+Using cached reportlab-4.4.10-py3-none-any.whl (2.0 MB)
+Installing collected packages: reportlab
+Successfully installed reportlab-4.4.10
--- a/backend/Dockerfile
+++ b/backend/Dockerfile
@@ -0,0 +1,40 @@
+# ============================================================
+# FilesReadSystem Backend Docker Image
+# ============================================================
+FROM python:3.12-slim
+
+ENV PYTHONDONTWRITEBYTECODE=1
+ENV PYTHONUNBUFFERED=1
+
+# 安装系统依赖 (FAISS, Pillow, tesseract 等)
+RUN apt-get update && apt-get install -y --no-install-recommends \
+    gcc \
+    g++ \
+    libgl1-mesa-glx \
+    libglib2.0-0 \
+    tesseract-ocr \
+    && rm -rf /var/lib/apt/lists/*
+
+WORKDIR /app
+
+# 先复制依赖文件，再安装（利用 Docker 缓存）
+COPY requirements.txt .
+
+# 安装 Python 依赖
+RUN pip install --no-cache-dir -r requirements.txt
+
+# 复制应用代码
+COPY app/ ./app/
+
+# 创建数据目录
+RUN mkdir -p /app/data/uploads /app/data/faiss /app/data/logs
+
+# 暴露端口
+EXPOSE 8000
+
+# 健康检查
+HEALTHCHECK --interval=30s --timeout=10s --start-period=10s --retries=3 \
+    CMD python -c "import httpx; httpx.get('http://localhost:8000/health')" || exit 1
+
+# 启动命令
+CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "8000"]
--- a/backend/app/api/init.py
+++ b/backend/app/api/init.py
@@ -15,6 +15,7 @@ from app.api.endpoints import (
    health,
    instruction,    # 智能指令
    conversation,   # 对话历史
+    pdf_converter,  # PDF转换
 )

 # 创建主路由
@@ -33,3 +34,4 @@ api_router.include_router(visualization.router)    # 可视化
 api_router.include_router(analysis_charts.router)  # 分析图表
 api_router.include_router(instruction.router)      # 智能指令
 api_router.include_router(conversation.router)     # 对话历史
+api_router.include_router(pdf_converter.router)   # PDF转换
--- a/backend/app/api/endpoints/ai_analyze.py
+++ b/backend/app/api/endpoints/ai_analyze.py
@@ -1,7 +1,7 @@
 """
 AI 分析 API 接口
 """
-from fastapi import APIRouter, UploadFile, File, HTTPException, Query, Body
+from fastapi import APIRouter, UploadFile, File, HTTPException, Query, Body, Form
 from fastapi.responses import StreamingResponse
 from typing import Optional
 import logging
@@ -21,7 +21,8 @@ router = APIRouter(prefix="/ai", tags=["AI 分析"])

@router.post("/analyze/excel")
 async def analyze_excel(
-    file: UploadFile = File(...),
+    file: Optional[UploadFile] = File(None),
+    doc_id: Optional[str] = Form(None, description="文档ID（从数据库读取）"),
    user_prompt: str = Query("", description="用户自定义提示词"),
    analysis_type: str = Query("general", description="分析类型: general, summary, statistics, insights"),
    parse_all_sheets: bool = Query(False, description="是否分析所有工作表")
@@ -30,7 +31,8 @@ async def analyze_excel(
    上传并使用 AI 分析 Excel 文件

    Args:
-        file: 上传的 Excel 文件
+        file: 上传的 Excel 文件（与 doc_id 二选一）
+        doc_id: 文档ID（从数据库读取）
        user_prompt: 用户自定义提示词
        analysis_type: 分析类型
        parse_all_sheets: 是否分析所有工作表
@@ -38,7 +40,57 @@ async def analyze_excel(
    Returns:
        dict: 分析结果，包含 Excel 数据和 AI 分析结果
    """
-    # 检查文件类型
+    filename = None
+
+    # 从数据库读取模式
+    if doc_id:
+        try:
+            from app.core.database.mongodb import mongodb
+            doc = await mongodb.get_document(doc_id)
+            if not doc:
+                raise HTTPException(status_code=404, detail=f"文档不存在: {doc_id}")
+
+            filename = doc.get("metadata", {}).get("original_filename", "unknown.xlsx")
+            file_ext = filename.split('.')[-1].lower()
+
+            if file_ext not in ['xlsx', 'xls']:
+                raise HTTPException(status_code=400, detail=f"文档类型不是 Excel: {file_ext}")
+
+            file_path = doc.get("metadata", {}).get("file_path")
+            if not file_path:
+                raise HTTPException(status_code=400, detail="文档没有存储文件路径，请重新上传")
+
+            # 使用文件路径进行 AI 分析
+            if parse_all_sheets:
+                result = await excel_ai_service.batch_analyze_sheets_from_path(
+                    file_path=file_path,
+                    filename=filename,
+                    user_prompt=user_prompt,
+                    analysis_type=analysis_type
+                )
+            else:
+                result = await excel_ai_service.analyze_excel_file_from_path(
+                    file_path=file_path,
+                    filename=filename,
+                    user_prompt=user_prompt,
+                    analysis_type=analysis_type
+                )
+
+            if result.get("success"):
+                return result
+            else:
+                return result
+
+        except HTTPException:
+            raise
+        except Exception as e:
+            logger.error(f"从数据库读取 Excel 文档失败: {str(e)}")
+            raise HTTPException(status_code=500, detail=f"读取文档失败: {str(e)}")
+
+    # 文件上传模式
+    if not file:
+        raise HTTPException(status_code=400, detail="请提供文件或文档ID")
+
    if not file.filename:
        raise HTTPException(status_code=400, detail="文件名为空")

@@ -61,7 +113,11 @@ async def analyze_excel(
        # 读取文件内容
        content = await file.read()

-        logger.info(f"开始分析文件: {file.filename}, 分析类型: {analysis_type}")
+        # 验证文件内容不为空
+        if not content:
+            raise HTTPException(status_code=400, detail="文件内容为空，请确保文件已正确上传")
+
+        logger.info(f"开始分析文件: {file.filename}, 分析类型: {analysis_type}, 文件大小: {len(content)} bytes")

        # 调用 AI 分析服务
        if parse_all_sheets:
@@ -155,7 +211,7 @@ async def analyze_text(
@router.post("/analyze/md")
 async def analyze_markdown(
    file: Optional[UploadFile] = File(None),
-    doc_id: Optional[str] = Query(None, description="文档ID（从数据库读取）"),
+    doc_id: Optional[str] = Form(None, description="文档ID（从数据库读取）"),
    analysis_type: str = Query("summary", description="分析类型: summary, outline, key_points, questions, tags, qa, statistics, section, charts"),
    user_prompt: str = Query("", description="用户自定义提示词"),
    section_number: Optional[str] = Query(None, description="指定章节编号，如 '一' 或 '（一）'")
@@ -198,7 +254,7 @@ async def analyze_markdown(
            if file_ext not in ['md', 'markdown']:
                raise HTTPException(status_code=400, detail=f"文档类型不是 Markdown: {file_ext}")

-            content = doc.get("content", "")
+            content = doc.get("content") or ""
            if not content:
                raise HTTPException(status_code=400, detail="文档内容为空")

@@ -392,7 +448,7 @@ async def get_markdown_outline(
@router.post("/analyze/txt")
 async def analyze_txt(
    file: Optional[UploadFile] = File(None),
-    doc_id: Optional[str] = Query(None, description="文档ID（从数据库读取）"),
+    doc_id: Optional[str] = Form(None, description="文档ID（从数据库读取）"),
    analysis_type: str = Query("structured", description="分析类型: structured, charts")
 ):
    """
@@ -427,7 +483,7 @@ async def analyze_txt(
                raise HTTPException(status_code=400, detail=f"文档类型不是 TXT: {file_ext}")

            # 使用数据库中的 content
-            text_content = doc.get("content", "")
+            text_content = doc.get("content") or ""

            if not text_content:
                raise HTTPException(status_code=400, detail="文档内容为空")
@@ -498,8 +554,8 @@ async def analyze_txt(
@router.post("/analyze/word")
 async def analyze_word(
    file: Optional[UploadFile] = File(None),
-    doc_id: Optional[str] = Query(None, description="文档ID（从数据库读取）"),
-    user_hint: str = Query("", description="用户提示词，如'请提取表格数据'"),
+    doc_id: Optional[str] = Form(None, description="文档ID（从数据库读取）"),
+    user_hint: str = Form("", description="用户提示词，如'请提取表格数据'"),
    analysis_type: str = Query("structured", description="分析类型: structured, charts")
 ):
    """
@@ -536,8 +592,9 @@ async def analyze_word(
                raise HTTPException(status_code=400, detail=f"文档类型不是 Word: {file_ext}")

            # 使用数据库中的 content 进行分析
-            content = doc.get("content", "")
-            tables = doc.get("structured_data", {}).get("tables", [])
+            content = doc.get("content", "") or ""
+            structured_data = doc.get("structured_data") or {}
+            tables = structured_data.get("tables", [])

            # 调用 AI 分析服务，传入数据库内容
            if analysis_type == "charts":
--- a/backend/app/api/endpoints/pdf_converter.py
+++ b/backend/app/api/endpoints/pdf_converter.py
@@ -0,0 +1,208 @@
+"""
+PDF 转换 API 接口
+
+提供将 Word、Excel、Txt、Markdown 转换为 PDF 的功能
+"""
+import logging
+import uuid
+from typing import Optional
+
+from fastapi import APIRouter, UploadFile, File, Form, HTTPException
+from fastapi.responses import StreamingResponse
+
+from app.services.pdf_converter_service import pdf_converter_service
+from app.services.file_service import file_service
+
+logger = logging.getLogger(__name__)
+
+router = APIRouter(prefix="/pdf", tags=["PDF转换"])
+
+# 临时存储转换后的 PDF（key: download_id, value: (pdf_content, original_filename)）
+_pdf_cache: dict = {}
+
+
+# ==================== 请求/响应模型 ====================
+
+class ConvertResponse:
+    """转换响应"""
+    def __init__(self, success: bool, message: str = "", filename: str = ""):
+        self.success = success
+        self.message = message
+        self.filename = filename
+
+
+# ==================== 接口 ====================
+
+@router.post("/convert")
+async def convert_to_pdf(
+    file: UploadFile = File(...),
+):
+    """
+    将上传的文件转换为 PDF
+
+    支持格式: docx, xlsx, txt, md
+
+    Args:
+        file: 上传的文件
+
+    Returns:
+        PDF 文件流
+    """
+    try:
+        # 检查文件格式
+        filename = file.filename or "document"
+        file_ext = filename.rsplit('.', 1)[-1].lower() if '.' in filename else ''
+
+        if file_ext not in pdf_converter_service.supported_formats:
+            raise HTTPException(
+                status_code=400,
+                detail=f"不支持的格式: {file_ext}，支持的格式: {', '.join(pdf_converter_service.supported_formats)}"
+            )
+
+        # 读取文件内容
+        content = await file.read()
+        if not content:
+            raise HTTPException(status_code=400, detail="文件内容为空")
+
+        logger.info(f"开始转换文件: {filename} ({file_ext})")
+
+        # 转换为 PDF
+        pdf_content, error = await pdf_converter_service.convert_to_pdf(
+            file_content=content,
+            source_format=file_ext,
+            filename=filename.rsplit('.', 1)[0] if '.' in filename else filename
+        )
+
+        if error:
+            raise HTTPException(status_code=500, detail=error)
+
+        # 直接返回 PDF 文件流
+        return StreamingResponse(
+            iter([pdf_content]),
+            media_type="application/pdf",
+            headers={
+                "Content-Disposition": f"attachment; filename*=UTF-8''converted.pdf"
+            }
+        )
+
+    except HTTPException:
+        raise
+    except Exception as e:
+        logger.error(f"PDF转换失败: {e}")
+        raise HTTPException(status_code=500, detail=f"转换失败: {str(e)}")
+
+
+@router.get("/download/{download_id}")
+async def download_pdf(download_id: str):
+    """
+    通过下载 ID 下载 PDF（支持 IDM 拦截）
+    """
+    if download_id not in _pdf_cache:
+        raise HTTPException(status_code=404, detail="下载链接已过期或不存在")
+
+    pdf_content, filename = _pdf_cache.pop(download_id)  # 下载后删除
+
+    # 使用 RFC 5987 编码支持中文文件名
+    from starlette.responses import StreamingResponse
+    import urllib.parse
+
+    # URL 编码中文文件名
+    encoded_filename = urllib.parse.quote(f"{filename}.pdf")
+
+    return StreamingResponse(
+        iter([pdf_content]),
+        media_type="application/pdf",
+        headers={
+            "Content-Disposition": f"attachment; filename*=UTF-8''{encoded_filename}"
+        }
+    )
+
+
+@router.get("/formats")
+async def get_supported_formats():
+    """
+    获取支持的源文件格式
+
+    Returns:
+        支持的格式列表
+    """
+    return {
+        "success": True,
+        "formats": pdf_converter_service.get_supported_formats()
+    }
+
+
+@router.post("/convert/batch")
+async def batch_convert_to_pdf(
+    files: list[UploadFile] = File(...),
+):
+    """
+    批量将多个文件转换为 PDF
+
+    注意: 批量转换会返回多个 PDF 文件打包的 zip
+
+    Args:
+        files: 上传的文件列表
+
+    Returns:
+        ZIP 压缩包（包含所有PDF）
+    """
+    try:
+        import io
+        import zipfile
+
+        results = []
+        errors = []
+
+        for file in files:
+            try:
+                filename = file.filename or "document"
+                file_ext = filename.rsplit('.', 1)[-1].lower() if '.' in filename else ''
+
+                if file_ext not in pdf_converter_service.supported_formats:
+                    errors.append(f"{filename}: 不支持的格式")
+                    continue
+
+                content = await file.read()
+                pdf_content, error = await pdf_converter_service.convert_to_pdf(
+                    file_content=content,
+                    source_format=file_ext,
+                    filename=filename.rsplit('.', 1)[0] if '.' in filename else filename
+                )
+
+                if error:
+                    errors.append(f"{filename}: {error}")
+                else:
+                    results.append((filename, pdf_content))
+
+            except Exception as e:
+                errors.append(f"{file.filename}: {str(e)}")
+
+        if not results:
+            raise HTTPException(
+                status_code=400,
+                detail=f"没有可转换的文件。错误: {'; '.join(errors)}"
+            )
+
+        # 创建 ZIP 包
+        zip_buffer = io.BytesIO()
+        with zipfile.ZipFile(zip_buffer, 'w', zipfile.ZIP_DEFLATED) as zip_file:
+            for original_name, pdf_content in results:
+                pdf_name = f"{original_name.rsplit('.', 1)[0] if '.' in original_name else original_name}.pdf"
+                zip_file.writestr(pdf_name, pdf_content)
+
+        zip_buffer.seek(0)
+
+        return StreamingResponse(
+            iter([zip_buffer.getvalue()]),
+            media_type="application/zip",
+            headers={
+                "Content-Disposition": "attachment; filename*=UTF-8''converted_pdfs.zip"
+            }
+        )
+
+    except HTTPException:
+        raise
+    except Exception as e:
+        logger.error(f"批量PDF转换失败: {e}")
+        raise HTTPException(status_code=500, detail=f"批量转换失败: {str(e)}")
--- a/backend/app/celery_app.py
+++ b/backend/app/celery_app.py
@@ -0,0 +1,27 @@
+# ============================================================
+# Celery 应用配置
+# ============================================================
+from celery import Celery
+
+# 优先使用环境变量，否则使用默认值
+import os
+
+CELERY_BROKER_URL = os.getenv("CELERY_BROKER_URL", "redis://localhost:6379/1")
+CELERY_RESULT_BACKEND = os.getenv("CELERY_RESULT_BACKEND", "redis://localhost:6379/2")
+
+celery_app = Celery(
+    "filesread",
+    broker=CELERY_BROKER_URL,
+    backend=CELERY_RESULT_BACKEND,
+)
+
+celery_app.conf.update(
+    task_serializer="json",
+    accept_content=["json"],
+    result_serializer="json",
+    timezone="Asia/Shanghai",
+    enable_utc=True,
+    task_track_started=True,
+    task_time_limit=3600,  # 1小时超时
+    worker_prefetch_multiplier=1,
+)
--- a/backend/app/core/document_parser/docx_parser.py
+++ b/backend/app/core/document_parser/docx_parser.py
@@ -91,11 +91,15 @@ class DocxParser(BaseParser):
                table_rows.append(row_data)

            if table_rows:
+                # 第一行作为表头，其余行作为数据
+                headers = table_rows[0] if table_rows else []
+                data_rows = table_rows[1:] if len(table_rows) > 1 else []
                tables_data.append({
                    "table_index": i,
-                    "rows": table_rows,
-                    "row_count": len(table_rows),
-                    "column_count": len(table_rows[0]) if table_rows else 0
+                    "headers": headers,  # 添加 headers 字段
+                    "rows": data_rows,  # 数据行（不含表头）
+                    "row_count": len(data_rows),
+                    "column_count": len(headers) if headers else 0
                })

        # 提取图片/嵌入式对象信息
--- a/backend/app/main.py
+++ b/backend/app/main.py
@@ -34,8 +34,8 @@ def setup_logging():
    # 根日志配置
    log_level = logging.DEBUG if settings.DEBUG else logging.INFO

-    # 日志目录
-    log_dir = Path("data/logs")
+    # 日志目录 (使用 settings.BASE_DIR 确保跨平台一致)
+    log_dir = settings.BASE_DIR / "data" / "logs"
    log_dir.mkdir(parents=True, exist_ok=True)

    # 日志文件路径
--- a/backend/app/services/excel_ai_service.py
+++ b/backend/app/services/excel_ai_service.py
@@ -223,6 +223,177 @@ class ExcelAIService:
            }
        }

+    async def analyze_excel_file_from_path(
+        self,
+        file_path: str,
+        filename: str,
+        user_prompt: str = "",
+        analysis_type: str = "general",
+        parse_options: Optional[Dict[str, Any]] = None
+    ) -> Dict[str, Any]:
+        """
+        从文件路径分析 Excel 文件（用于从数据库加载的文档）
+
+        Args:
+            file_path: Excel 文件路径
+            filename: 文件名
+            user_prompt: 用户自定义提示词
+            analysis_type: 分析类型
+            parse_options: 解析选项
+
+        Returns:
+            Dict[str, Any]: 分析结果
+        """
+        # 1. 解析 Excel 文件
+        excel_data = None
+        parse_result_metadata = None
+        try:
+            parse_options = parse_options or {}
+            parse_result = self.parser.parse(file_path, **parse_options)
+
+            if not parse_result.success:
+                return {
+                    "success": False,
+                    "error": parse_result.error,
+                    "analysis": None
+                }
+
+            excel_data = parse_result.data
+            parse_result_metadata = parse_result.metadata
+            logger.info(f"Excel 解析成功: {parse_result_metadata}")
+
+        except Exception as e:
+            logger.error(f"Excel 解析失败: {str(e)}")
+            return {
+                "success": False,
+                "error": f"Excel 解析失败: {str(e)}",
+                "analysis": None
+            }
+
+        # 2. 调用 LLM 进行分析
+        try:
+            if user_prompt and user_prompt.strip():
+                llm_result = await self.llm_service.analyze_with_template(
+                    excel_data,
+                    user_prompt
+                )
+            else:
+                llm_result = await self.llm_service.analyze_excel_data(
+                    excel_data,
+                    user_prompt,
+                    analysis_type
+                )
+
+            logger.info(f"AI 分析完成: {llm_result['success']}")
+
+            return {
+                "success": True,
+                "excel": {
+                    "data": excel_data,
+                    "metadata": parse_result_metadata,
+                    "saved_path": file_path
+                },
+                "analysis": llm_result
+            }
+
+        except Exception as e:
+            logger.error(f"AI 分析失败: {str(e)}")
+            return {
+                "success": False,
+                "error": f"AI 分析失败: {str(e)}",
+                "excel": {
+                    "data": excel_data,
+                    "metadata": parse_result_metadata
+                },
+                "analysis": None
+            }
+
+    async def batch_analyze_sheets_from_path(
+        self,
+        file_path: str,
+        filename: str,
+        user_prompt: str = "",
+        analysis_type: str = "general"
+    ) -> Dict[str, Any]:
+        """
+        从文件路径批量分析 Excel 文件的所有工作表（用于从数据库加载的文档）
+
+        Args:
+            file_path: Excel 文件路径
+            filename: 文件名
+            user_prompt: 用户自定义提示词
+            analysis_type: 分析类型
+
+        Returns:
+            Dict[str, Any]: 分析结果
+        """
+        # 1. 解析所有工作表
+        try:
+            parse_result = self.parser.parse_all_sheets(file_path)
+
+            if not parse_result.success:
+                return {
+                    "success": False,
+                    "error": parse_result.error,
+                    "analysis": None
+                }
+
+            sheets_data = parse_result.data.get("sheets", {})
+            logger.info(f"Excel 解析成功，共 {len(sheets_data)} 个工作表")
+
+        except Exception as e:
+            logger.error(f"Excel 解析失败: {str(e)}")
+            return {
+                "success": False,
+                "error": f"Excel 解析失败: {str(e)}",
+                "analysis": None
+            }
+
+        # 2. 批量分析每个工作表
+        sheet_analyses = {}
+        errors = {}
+
+        for sheet_name, sheet_data in sheets_data.items():
+            try:
+                if user_prompt and user_prompt.strip():
+                    llm_result = await self.llm_service.analyze_with_template(
+                        sheet_data,
+                        user_prompt
+                    )
+                else:
+                    llm_result = await self.llm_service.analyze_excel_data(
+                        sheet_data,
+                        user_prompt,
+                        analysis_type
+                    )
+
+                sheet_analyses[sheet_name] = llm_result
+
+                if not llm_result["success"]:
+                    errors[sheet_name] = llm_result.get("error", "未知错误")
+
+                logger.info(f"工作表 '{sheet_name}' 分析完成")
+
+            except Exception as e:
+                logger.error(f"工作表 '{sheet_name}' 分析失败: {str(e)}")
+                errors[sheet_name] = str(e)
+
+        # 3. 组合结果
+        return {
+            "success": len(errors) == 0,
+            "excel": {
+                "sheets": sheets_data,
+                "metadata": parse_result.metadata,
+                "saved_path": file_path
+            },
+            "analysis": {
+                "sheets": sheet_analyses,
+                "total_sheets": len(sheets_data),
+                "successful": len(sheet_analyses) - len(errors),
+                "errors": errors
+            }
+        }
+
    def get_supported_analysis_types(self) -> List[str]:
        """获取支持的分析类型"""
        return [
--- a/backend/app/services/llm_service.py
+++ b/backend/app/services/llm_service.py
@@ -54,15 +54,21 @@ class LLMService:
        # 添加其他参数
        payload.update(kwargs)

+        import time
+        _start_time = time.time()
+        logger.info(f"🤖 [LLM] 正在调用 DeepSeek API... 模型: {self.model_name}")
        try:
-            async with httpx.AsyncClient(timeout=60.0) as client:
+            async with httpx.AsyncClient(timeout=120.0) as client:
                response = await client.post(
                    f"{self.base_url}/chat/completions",
                    headers=headers,
                    json=payload
                )
                response.raise_for_status()
-                return response.json()
+                result = response.json()
+                _elapsed = time.time() - _start_time
+                logger.info(f"✅ [LLM] DeepSeek API 响应成功 | 模型: {self.model_name} | 耗时: {_elapsed:.2f}s | Token: {result.get('usage', {}).get('total_tokens', 'N/A')}")
+                return result

        except httpx.HTTPStatusError as e:
            error_detail = e.response.text
@@ -78,7 +84,7 @@ class LLMService:
                pass
            raise
        except Exception as e:
-            logger.error(f"LLM API 调用异常: {str(e)}")
+            logger.error(f"LLM API 调用异常: {repr(e)} - {str(e)}")
            raise

    def extract_message_content(self, response: Dict[str, Any]) -> str:
@@ -133,6 +139,9 @@ class LLMService:

        payload.update(kwargs)

+        import time
+        _start_time = time.time()
+        logger.info(f"🤖 [LLM] 正在调用 DeepSeek API (流式) | 模型: {self.model_name}")
        try:
            async with httpx.AsyncClient(timeout=120.0) as client:
                async with client.stream(
@@ -141,10 +150,13 @@ class LLMService:
                    headers=headers,
                    json=payload
                ) as response:
+                    _elapsed = time.time() - _start_time
+                    logger.info(f"✅ [LLM] DeepSeek API 流式响应开始 | 模型: {self.model_name} | 耗时: {_elapsed:.2f}s")
                    async for line in response.aiter_lines():
                        if line.startswith("data: "):
                            data = line[6:]  # Remove "data: " prefix
                            if data == "[DONE]":
+                                logger.info(f"✅ [LLM] DeepSeek API 流式响应完成")
                                break
                            try:
                                import json as json_module
--- a/backend/app/services/pdf_converter_service.py
+++ b/backend/app/services/pdf_converter_service.py
@@ -0,0 +1,403 @@
+"""
+PDF 转换服务
+
+支持将 Word(docx)、Excel(xlsx)、Txt、Markdown(md) 格式转换为 PDF
+策略：所有格式先转为 Markdown，再通过 Markdown 转 PDF
+"""
+import io
+import logging
+import platform
+from pathlib import Path
+from typing import List, Tuple
+
+from reportlab.lib.pagesizes import A4
+from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
+from reportlab.lib.enums import TA_LEFT, TA_CENTER, TA_JUSTIFY
+from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, Table, TableStyle
+from reportlab.pdfbase import pdfmetrics
+from reportlab.pdfbase.ttfonts import TTFont
+
+logger = logging.getLogger(__name__)
+
+
+class PDFConverterService:
+    """PDF 转换服务"""
+
+    def __init__(self):
+        self.supported_formats = ["docx", "xlsx", "txt", "md"]
+        self._font_name = None
+        self._styles = None
+        self._page_width = None
+        self._page_height = None
+        self._setup_fonts()
+
+    def _setup_fonts(self):
+        """设置字体"""
+        try:
+            self._page_width, self._page_height = A4
+
+            # 查找中文字体
+            font_path = self._find_chinese_font()
+            if font_path:
+                try:
+                    font = TTFont('ChineseFont', font_path)
+                    pdfmetrics.registerFont(font)
+                    from reportlab.pdfbase.pdfmetrics import registerFontFamily
+                    registerFontFamily('ChineseFont', normal='ChineseFont')
+                    self._font_name = 'ChineseFont'
+                    logger.info(f"成功注册中文字体: {font_path}")
+                except Exception as e:
+                    logger.warning(f"字体注册失败: {e}, 使用Helvetica")
+                    self._font_name = 'Helvetica'
+            else:
+                self._font_name = 'Helvetica'
+                logger.warning("未找到中文字体，使用 Helvetica（不支持中文）")
+
+            # 创建样式
+            styles = getSampleStyleSheet()
+
+            styles.add(ParagraphStyle(
+                name='ChineseTitle',
+                fontName=self._font_name,
+                fontSize=16,
+                leading=22,
+                alignment=TA_CENTER,
+                spaceAfter=12,
+            ))
+
+            styles.add(ParagraphStyle(
+                name='ChineseHeading',
+                fontName=self._font_name,
+                fontSize=14,
+                leading=20,
+                spaceBefore=10,
+                spaceAfter=8,
+            ))
+
+            styles.add(ParagraphStyle(
+                name='ChineseBody',
+                fontName=self._font_name,
+                fontSize=10,
+                leading=14,
+                alignment=TA_JUSTIFY,
+                spaceAfter=6,
+            ))
+
+            styles.add(ParagraphStyle(
+                name='ChineseCode',
+                fontName='Courier',
+                fontSize=9,
+                leading=12,
+            ))
+
+            self._styles = styles
+            logger.info("PDF服务初始化完成")
+
+        except Exception as e:
+            logger.error(f"PDF服务初始化失败: {e}")
+            raise
+
+    def _find_chinese_font(self) -> str:
+        """查找中文字体"""
+        system = platform.system()
+
+        if system == "Windows":
+            fonts = [
+                "C:/Windows/Fonts/simhei.ttf",
+                "C:/Windows/Fonts/simsun.ttc",
+                "C:/Windows/Fonts/msyh.ttc",
+                "C:/Windows/Fonts/simsun.ttf",
+            ]
+        elif system == "Darwin":
+            fonts = [
+                "/System/Library/Fonts/STHeiti Light.ttc",
+                "/System/Library/Fonts/PingFang.ttc",
+                "/Library/Fonts/Arial Unicode.ttf",
+            ]
+        else:
+            fonts = [
+                "/usr/share/fonts/truetype/wqy/wqy-microhei.ttc",
+                "/usr/share/fonts/opentype/noto/NotoSansCJK-Regular.ttc",
+            ]
+
+        for font in fonts:
+            if Path(font).exists():
+                return font
+        return None
+
+    def _sanitize_text(self, text: str) -> str:
+        """清理文本"""
+        if not text:
+            return ""
+        return text.replace('\x00', '')
+
+    async def convert_to_pdf(
+        self,
+        file_content: bytes,
+        source_format: str,
+        filename: str = "document"
+    ) -> Tuple[bytes, str]:
+        """将文档转换为 PDF"""
+        try:
+            if source_format.lower() not in self.supported_formats:
+                return b"", f"不支持的格式: {source_format}"
+
+            # 第一步：转换为 Markdown
+            markdown_content, error = await self._convert_to_markdown(file_content, source_format, filename)
+            if error:
+                return b"", error
+
+            # 第二步：Markdown 转 PDF
+            return await self._convert_markdown_to_pdf(markdown_content, filename)
+
+        except Exception as e:
+            logger.error(f"PDF转换失败: {e}")
+            import traceback
+            logger.error(f"详细错误: {traceback.format_exc()}")
+            return b"", f"转换失败: {str(e)}"
+
+    async def _convert_to_markdown(
+        self,
+        file_content: bytes,
+        source_format: str,
+        filename: str
+    ) -> Tuple[str, str]:
+        """将各种格式转换为 Markdown"""
+        converters = {
+            "docx": self._convert_docx_to_markdown,
+            "xlsx": self._convert_xlsx_to_markdown,
+            "txt": self._convert_txt_to_markdown,
+            "md": self._convert_md_to_markdown,
+        }
+        return await converters[source_format.lower()](file_content, filename)
+
+    async def _convert_txt_to_markdown(self, file_content: bytes, filename: str) -> Tuple[str, str]:
+        """Txt 转 Markdown"""
+        try:
+            text = self._decode_content(file_content)
+            text = self._sanitize_text(text)
+            return f"# {filename}\n\n{text}", ""
+        except Exception as e:
+            logger.error(f"Txt转Markdown失败: {e}")
+            return "", f"文本文件处理失败: {str(e)}"
+
+    async def _convert_md_to_markdown(self, file_content: bytes, filename: str) -> Tuple[str, str]:
+        """Markdown 原样返回"""
+        try:
+            content = self._decode_content(file_content)
+            content = self._sanitize_text(content)
+            return f"# {filename}\n\n{content}", ""
+        except Exception as e:
+            logger.error(f"Markdown处理失败: {e}")
+            return "", f"Markdown处理失败: {str(e)}"
+
+    async def _convert_docx_to_markdown(self, file_content: bytes, filename: str) -> Tuple[str, str]:
+        """Word 转 Markdown - 使用 zipfile 直接解析，更加健壮"""
+        try:
+            import zipfile
+            import re
+
+            lines = [f"# {filename}", ""]
+
+            # 直接使用 zipfile 解析 DOCX，避免 python-docx 的严格验证
+            try:
+                with zipfile.ZipFile(io.BytesIO(file_content), 'r') as zf:
+                    # 读取主文档内容
+                    xml_content = zf.read('word/document.xml').decode('utf-8')
+            except zipfile.BadZipFile:
+                return "", "文件不是有效的 DOCX 格式"
+            except KeyError:
+                return "", "DOCX 文件损坏：找不到 document.xml"
+
+            # 简单的 XML 解析 - 提取文本段落
+            # 移除 XML 标签，提取纯文本
+            xml_content = re.sub(r'<w:br[^>]*>', '\n', xml_content)
+            xml_content = re.sub(r'</w:p>', '\n', xml_content)
+            xml_content = re.sub(r'<[^>]+>', '', xml_content)
+            xml_content = re.sub(r'\n\s*\n', '\n\n', xml_content)
+
+            # 解码 HTML 实体
+            xml_content = xml_content.replace('&amp;', '&')
+            xml_content = xml_content.replace('&lt;', '<')
+            xml_content = xml_content.replace('&gt;', '>')
+            xml_content = xml_content.replace('&quot;', '"')
+            xml_content = xml_content.replace('&#39;', "'")
+
+            # 清理空白
+            lines_text = [line.strip() for line in xml_content.split('\n') if line.strip()]
+
+            # 生成 Markdown
+            for text in lines_text[:500]:  # 限制最多500行
+                if text:
+                    lines.append(text)
+
+            return '\n'.join(lines), ""
+
+        except Exception as e:
+            logger.error(f"Word转Markdown失败: {e}")
+            import traceback
+            logger.error(traceback.format_exc())
+            return "", f"Word文档处理失败: {str(e)}"
+            for table in doc.tables:
+                lines.append("")
+                for row in table.rows:
+                    row_data = [cell.text.strip() for cell in row.cells]
+                    lines.append("| " + " | ".join(row_data) + " |")
+                # 表头分隔符
+                if table.rows:
+                    lines.append("| " + " | ".join(["---"] * len(table.rows[0].cells)) + " |")
+
+            return "\n".join(lines), ""
+
+        except Exception as e:
+            logger.error(f"Word转Markdown失败: {e}")
+            return "", f"Word文档处理失败: {str(e)}"
+
+    async def _convert_xlsx_to_markdown(self, file_content: bytes, filename: str) -> Tuple[str, str]:
+        """Excel 转 Markdown"""
+        try:
+            import openpyxl
+
+            wb = openpyxl.load_workbook(io.BytesIO(file_content))
+            lines = [f"# {filename} - Excel数据", ""]
+
+            for sheet_name in wb.sheetnames[:10]:
+                ws = wb[sheet_name]
+                lines.append(f"## 工作表: {sheet_name}")
+                lines.append("")
+
+                for row_idx, row in enumerate(ws.iter_rows(max_row=50, values_only=True)):
+                    row_data = [str(cell) if cell is not None else "" for cell in row]
+                    if not any(row_data):
+                        continue
+                    lines.append("| " + " | ".join(row_data) + " |")
+                    if row_idx == 0:
+                        lines.append("| " + " | ".join(["---"] * len(row_data)) + " |")
+
+                lines.append("")
+
+            return "\n".join(lines), ""
+
+        except Exception as e:
+            logger.error(f"Excel转Markdown失败: {e}")
+            return "", f"Excel处理失败: {str(e)}"
+
+    async def _convert_markdown_to_pdf(self, markdown_content: str, filename: str) -> Tuple[bytes, str]:
+        """Markdown 转 PDF"""
+        try:
+            logger.info(f"Markdown转PDF开始 - filename={filename}, 字体={self._font_name}")
+            logger.info(f"styles['ChineseTitle'].fontName={self._styles['ChineseTitle'].fontName}")
+
+            buffer = io.BytesIO()
+            story = []
+
+            safe_filename = self._sanitize_text(filename)
+            logger.info(f"safe_filename={repr(safe_filename[:50])}")
+
+            story.append(Paragraph(text=safe_filename, style=self._styles['ChineseTitle']))
+            story.append(Spacer(1, 12))
+
+            in_code = False
+            for line in markdown_content.split('\n'):
+                line = line.strip()
+
+                if line.startswith('```'):
+                    in_code = not in_code
+                    story.append(Spacer(1, 6))
+                    continue
+
+                if in_code:
+                    story.append(Paragraph(text=self._sanitize_text(line), style=self._styles['ChineseCode']))
+                    continue
+
+                if not line:
+                    story.append(Spacer(1, 6))
+                    continue
+
+                # 标题处理
+                if line.startswith('# '):
+                    story.append(Paragraph(text=self._sanitize_text(line[2:]), style=self._styles['ChineseHeading']))
+                elif line.startswith('## '):
+                    story.append(Paragraph(text=self._sanitize_text(line[3:]), style=self._styles['ChineseHeading']))
+                elif line.startswith('### '):
+                    story.append(Paragraph(text=self._sanitize_text(line[4:]), style=self._styles['ChineseHeading']))
+                elif line.startswith('#### '):
+                    story.append(Paragraph(text=self._sanitize_text(line[5:]), style=self._styles['ChineseHeading']))
+                elif line.startswith('- ') or line.startswith('* '):
+                    story.append(Paragraph(text="• " + self._sanitize_text(line[2:]), style=self._styles['ChineseBody']))
+                # 表格处理
+                elif line.startswith('|'):
+                    # 跳过 markdown 表格分隔符
+                    if set(line.replace('|', '').replace('-', '').replace(':', '').replace(' ', '')) == set():
+                        continue
+                    # 解析并创建表格
+                    table_lines = []
+                    for _ in range(50):  # 最多50行
+                        if line.startswith('|'):
+                            row = [cell.strip() for cell in line.split('|')[1:-1]]
+                            if not any(row) or set(''.join(row).replace('-', '').replace(':', '').replace(' ', '')) == set():
+                                break
+                            table_lines.append(row)
+                            try:
+                                line = next(markdown_content.split('\n').__iter__()).strip()
+                            except StopIteration:
+                                break
+                        else:
+                            break
+
+                    if table_lines:
+                        # 创建表格
+                        t = Table(table_lines, colWidths=[100] * len(table_lines[0]))
+                        t.setStyle(TableStyle([
+                            ('FONTNAME', (0, 0), (-1, -1), self._font_name),
+                            ('FONTSIZE', (0, 0), (-1, -1), 9),
+                            ('GRID', (0, 0), (-1, -1), 0.5, '#999999'),
+                            ('BACKGROUND', (0, 0), (-1, 0), '#4472C4'),
+                            ('TEXTCOLOR', (0, 0), (-1, 0), '#FFFFFF'),
+                        ]))
+                        story.append(t)
+                        story.append(Spacer(1, 6))
+                else:
+                    story.append(Paragraph(text=self._sanitize_text(line), style=self._styles['ChineseBody']))
+
+            logger.info(f"准备构建PDF，story长度={len(story)}")
+
+            pdf_doc = SimpleDocTemplate(
+                buffer,
+                pagesize=(self._page_width, self._page_height),
+                rightMargin=72,
+                leftMargin=72,
+                topMargin=72,
+                bottomMargin=72
+            )
+            logger.info("调用pdf_doc.build()")
+            pdf_doc.build(story)
+            logger.info("pdf_doc.build()完成")
+
+            result = buffer.getvalue()
+            buffer.close()
+            return result, ""
+
+        except Exception as e:
+            logger.error(f"Markdown转PDF失败: {e}")
+            import traceback
+            logger.error(f"详细错误: {traceback.format_exc()}")
+            return b"", f"Markdown转PDF失败: {str(e)}"
+
+    def _decode_content(self, file_content: bytes) -> str:
+        """解码文件内容"""
+        encodings = ['utf-8', 'gbk', 'gb2312', 'gb18030', 'latin-1']
+        for enc in encodings:
+            try:
+                return file_content.decode(enc)
+            except (UnicodeDecodeError, LookupError):
+                continue
+        return file_content.decode('utf-8', errors='replace')
+
+    def get_supported_formats(self) -> List[str]:
+        """获取支持的格式"""
+        return self.supported_formats
+
+
+# 全局单例
+pdf_converter_service = PDFConverterService()
--- a/backend/app/services/rag_service.py
+++ b/backend/app/services/rag_service.py
@@ -669,7 +669,7 @@ class RAGService:
        # 按融合分数降序排序
        fused_results.sort(key=lambda x: x["score"], reverse=True)

-        logger.debug(f"混合融合: {len(fused_results)} 个文档, 向量:{len(vector_results)}, BM25:{len(bm25_results)}")
+        logger.info(f"RRF 混合融合: {len(fused_results)} 个文档参与融合, 向量检索命中:{len(vector_results)}, BM25命中:{len(bm25_results)}")

        return fused_results[:top_k]

--- a/backend/app/services/txt_ai_service.py
+++ b/backend/app/services/txt_ai_service.py
@@ -19,6 +19,7 @@ class TxtAIService:

    def __init__(self):
        self.parser = TxtParser()
+        self.llm = llm_service

    async def analyze_txt_with_ai(
        self,
@@ -114,7 +115,7 @@ class TxtAIService:
            response = await self.llm.chat(
                messages=messages,
                temperature=0.1,
-                max_tokens=50000
+                max_tokens=8000
            )

            content_text = self.llm.extract_message_content(response)
@@ -220,7 +221,7 @@ class TxtAIService:
            response = await self.llm.chat(
                messages=messages,
                temperature=0.1,
-                max_tokens=50000
+                max_tokens=8000
            )

            content_text = self.llm.extract_message_content(response)
--- a/backend/app/services/visualization_service.py
+++ b/backend/app/services/visualization_service.py
@@ -53,7 +53,11 @@ class VisualizationService:
                }

            # 转换为 DataFrame
-            df = pd.DataFrame(rows, columns=columns)
+            # 过滤掉行数与列数不匹配的数据
+            valid_rows = [row for row in rows if len(row) == len(columns)]
+            if len(valid_rows) < len(rows):
+                logger.warning(f"过滤了 {len(rows) - len(valid_rows)} 行无效数据（列数不匹配）")
+            df = pd.DataFrame(valid_rows, columns=columns)

            # 根据列类型分类
            numeric_columns = df.select_dtypes(include=[np.number]).columns.tolist()
@@ -141,18 +145,18 @@ class VisualizationService:
        charts = {}

        # 1. 数值型列的直方图
-        charts["histograms"] = []
+        charts["numeric_charts"] = []
        for col in numeric_columns[:5]:  # 限制最多 5 个数值列
            chart_data = self._create_histogram(df[col], col)
            if chart_data:
-                charts["histograms"].append(chart_data)
+                charts["numeric_charts"].append(chart_data)

        # 2. 分类型列的条形图
-        charts["bar_charts"] = []
+        charts["categorical_charts"] = []
        for col in categorical_columns[:5]:  # 限制最多 5 个分类型列
            chart_data = self._create_bar_chart(df[col], col)
            if chart_data:
-                charts["bar_charts"].append(chart_data)
+                charts["categorical_charts"].append(chart_data)

        # 3. 数值型列的箱线图
        charts["box_plots"] = []
--- a/backend/app/services/word_ai_service.py
+++ b/backend/app/services/word_ai_service.py
@@ -184,7 +184,7 @@ class WordAIService:
            response = await self.llm.chat(
                messages=messages,
                temperature=0.1,
-                max_tokens=50000
+                max_tokens=8000
            )

            content = self.llm.extract_message_content(response)
@@ -276,7 +276,7 @@ class WordAIService:
            response = await self.llm.chat(
                messages=messages,
                temperature=0.1,
-                max_tokens=50000
+                max_tokens=8000
            )

            content = self.llm.extract_message_content(response)
@@ -849,10 +849,12 @@ class WordAIService:

            # 提取可用于图表的数据
            chart_data = None
+            logger.info(f"准备提取图表数据，structured_data type: {structured_data.get('type')}, keys: {list(structured_data.keys())}")

            if structured_data.get("type") == "table_data":
                headers = structured_data.get("headers", [])
                rows = structured_data.get("rows", [])
+                logger.info(f"table_data类型: headers数量={len(headers)}, rows数量={len(rows)}")
                if headers and rows:
                    chart_data = {
                        "columns": headers,
@@ -860,15 +862,19 @@ class WordAIService:
                    }
            elif structured_data.get("type") == "structured_text":
                tables_data = structured_data.get("tables", [])
+                logger.info(f"structured_text类型: tables数量={len(tables_data)}")
                if tables_data and len(tables_data) > 0:
                    first_table = tables_data[0]
                    headers = first_table.get("headers", [])
                    rows = first_table.get("rows", [])
+                    logger.info(f"第一个表格: headers={headers[:5]}, rows数量={len(rows)}")
                    if headers and rows:
                        chart_data = {
                            "columns": headers,
                            "rows": rows
                        }
+            else:
+                logger.warning(f"无法识别的structured_data类型: {structured_data.get('type')}")

            # 生成可视化图表
            if chart_data:
@@ -904,3 +910,6 @@ class WordAIService:
                "success": False,
                "error": str(e)
            }
+
+
+word_ai_service = WordAIService()
--- a/backend/requirements.txt
+++ b/backend/requirements.txt
@@ -42,6 +42,9 @@ chardet==5.2.0
 Pillow>=10.0.0
 pytesseract>=0.3.10

+# ==================== PDF 生成 ====================
+reportlab>=4.0.0
+
 # ==================== AI / LLM ====================
 httpx==0.25.2

--- a/docker-compose.yml
+++ b/docker-compose.yml
@@ -0,0 +1,203 @@
+# ============================================================
+# FilesReadSystem Docker Compose
+# 全栈 AI 文档理解与数据融合系统
+# ============================================================
+version: "3.8"
+
+services:
+  # ==================== 数据库服务 ====================
+
+  mongodb:
+    image: mongo:7.0
+    container_name: filesread_mongodb
+    restart: unless-stopped
+    ports:
+      - "27017:27017"
+    environment:
+      MONGO_INITDB_ROOT_USERNAME: ${MONGO_ROOT_USER:-admin}
+      MONGO_INITDB_ROOT_PASSWORD: ${MONGO_ROOT_PASSWORD:-20060825fhy}
+      MONGO_INITDB_DATABASE: ${MONGODB_DB_NAME:-document_system}
+    volumes:
+      - mongodb_data:/data/db
+    networks:
+      - filesread_network
+    healthcheck:
+      test: ["CMD", "mongosh", "--eval", "db.adminCommand('ping')", "--quiet"]
+      interval: 10s
+      timeout: 5s
+      retries: 5
+      start_period: 30s
+
+  mysql:
+    image: mysql:8.0
+    container_name: filesread_mysql
+    restart: unless-stopped
+    ports:
+      - "3306:3306"
+    environment:
+      MYSQL_ROOT_PASSWORD: ${MYSQL_PASSWORD:-123456}
+      MYSQL_DATABASE: ${MYSQL_DATABASE:-document}
+    volumes:
+      - mysql_data:/var/lib/mysql
+    networks:
+      - filesread_network
+    healthcheck:
+      test: ["CMD", "mysqladmin", "ping", "-h", "localhost", "-u", "root", "-p${MYSQL_PASSWORD:-123456}"]
+      interval: 10s
+      timeout: 5s
+      retries: 5
+      start_period: 30s
+
+  redis:
+    image: redis:7-alpine
+    container_name: filesread_redis
+    restart: unless-stopped
+    ports:
+      - "6379:6379"
+    volumes:
+      - redis_data:/data
+    networks:
+      - filesread_network
+    command: redis-server --appendonly yes --requirepass ${REDIS_PASSWORD:-}
+    healthcheck:
+      test: ["CMD", "redis-cli", "ping"]
+      interval: 10s
+      timeout: 5s
+      retries: 5
+
+  # ==================== 应用服务 ====================
+
+  backend:
+    build:
+      context: ./backend
+      dockerfile: Dockerfile
+    container_name: filesread_backend
+    restart: unless-stopped
+    ports:
+      - "8000:8000"
+    environment:
+      # 应用配置
+      APP_NAME: FilesReadSystem
+      DEBUG: ${DEBUG:-false}
+      API_V1_STR: /api/v1
+
+      # MongoDB 配置 (使用 docker-compose 服务名)
+      MONGODB_URL: mongodb://${MONGO_ROOT_USER:-admin}:${MONGO_ROOT_PASSWORD:-20060825fhy}@mongodb:27017/admin
+      MONGODB_DB_NAME: ${MONGODB_DB_NAME:-document_system}
+
+      # MySQL 配置
+      MYSQL_HOST: mysql
+      MYSQL_PORT: 3306
+      MYSQL_USER: root
+      MYSQL_PASSWORD: ${MYSQL_PASSWORD:-123456}
+      MYSQL_DATABASE: ${MYSQL_DATABASE:-document}
+      MYSQL_CHARSET: utf8mb4
+
+      # Redis 配置
+      REDIS_URL: redis://:${REDIS_PASSWORD:-}@redis:6379/0
+
+      # LLM AI 配置
+      LLM_API_KEY: ${LLM_API_KEY}
+      LLM_BASE_URL: ${LLM_BASE_URL:-https://api.deepseek.com}
+      LLM_MODEL_NAME: ${LLM_MODEL_NAME:-deepseek-chat}
+
+      # Supabase 配置
+      SUPABASE_URL: ${SUPABASE_URL}
+      SUPABASE_ANON_KEY: ${SUPABASE_ANON_KEY}
+      SUPABASE_SERVICE_KEY: ${SUPABASE_SERVICE_KEY}
+
+      # Embedding / RAG 配置
+      EMBEDDING_MODEL: ${EMBEDDING_MODEL:-all-MiniLM-L6-v2}
+      FAISS_INDEX_DIR: /app/data/faiss
+
+      # 文件路径配置
+      UPLOAD_DIR: /app/data/uploads
+      MAX_UPLOAD_SIZE: 104857600
+
+      # Celery 配置
+      CELERY_BROKER_URL: redis://:${REDIS_PASSWORD:-}@redis:6379/1
+      CELERY_RESULT_BACKEND: redis://:${REDIS_PASSWORD:-}@redis:6379/2
+    volumes:
+      - backend_data:/app/data
+    networks:
+      - filesread_network
+    depends_on:
+      mongodb:
+        condition: service_healthy
+      mysql:
+        condition: service_healthy
+      redis:
+        condition: service_healthy
+    healthcheck:
+      test: ["CMD", "python", "-c", "import httpx; httpx.get('http://localhost:8000/health')"]
+      interval: 30s
+      timeout: 10s
+      retries: 3
+      start_period: 40s
+
+  celery_worker:
+    build:
+      context: ./backend
+      dockerfile: Dockerfile
+    container_name: filesread_celery
+    restart: unless-stopped
+    command: celery -A app.celery_app worker --loglevel=info --prefetch-multiplier=1
+    environment:
+      # Celery 配置
+      CELERY_BROKER_URL: redis://:${REDIS_PASSWORD:-}@redis:6379/1
+      CELERY_RESULT_BACKEND: redis://:${REDIS_PASSWORD:-}@redis:6379/2
+
+      # 复用后端的数据库配置
+      MONGODB_URL: mongodb://${MONGO_ROOT_USER:-admin}:${MONGO_ROOT_PASSWORD:-20060825fhy}@mongodb:27017/admin
+      MONGODB_DB_NAME: ${MONGODB_DB_NAME:-document_system}
+      MYSQL_HOST: mysql
+      MYSQL_PORT: 3306
+      MYSQL_USER: root
+      MYSQL_PASSWORD: ${MYSQL_PASSWORD:-123456}
+      MYSQL_DATABASE: ${MYSQL_DATABASE:-document}
+      REDIS_URL: redis://:${REDIS_PASSWORD:-}@redis:6379/0
+
+      # LLM 配置
+      LLM_API_KEY: ${LLM_API_KEY}
+      LLM_BASE_URL: ${LLM_BASE_URL:-https://api.deepseek.com}
+      LLM_MODEL_NAME: ${LLM_MODEL_NAME:-deepseek-chat}
+
+      # Embedding 配置
+      EMBEDDING_MODEL: ${EMBEDDING_MODEL:-all-MiniLM-L6-v2}
+      FAISS_INDEX_DIR: /app/data/faiss
+    volumes:
+      - backend_data:/app/data
+    networks:
+      - filesread_network
+    depends_on:
+      - redis
+      - mongodb
+      - mysql
+
+  frontend:
+    build:
+      context: ./frontend
+      dockerfile: Dockerfile
+    container_name: filesread_frontend
+    restart: unless-stopped
+    ports:
+      - "80:80"
+    environment:
+      VITE_APP_ID: ${VITE_APP_ID:-}
+      VITE_SUPABASE_URL: ${SUPABASE_URL}
+      VITE_SUPABASE_ANON_KEY: ${SUPABASE_ANON_KEY}
+      VITE_BACKEND_API_URL: /api/v1
+    networks:
+      - filesread_network
+    depends_on:
+      - backend
+
+networks:
+  filesread_network:
+    driver: bridge
+
+volumes:
+  mongodb_data:
+  mysql_data:
+  redis_data:
+  backend_data:
--- a/docs/architecture.drawio
+++ b/docs/architecture.drawio
@@ -0,0 +1,169 @@
+<mxfile host="app.diagrams.net" modified="2026-04-16T14:00:00.000Z" agent="Claude" version="24.0.0">
+  <diagram name="系统架构图" id="architecture">
+    <mxGraphModel dx="1200" dy="800" grid="1" gridSize="10" guides="1" tooltips="1" connect="1" arrows="1" fold="1" page="1" pageScale="1" pageWidth="1920" pageHeight="1080" math="0" shadow="0">
+      <root>
+        <mxCell id="0" />
+        <mxCell id="1" parent="0" />
+
+        <!-- 用户访问层 -->
+        <mxCell id="layer1" value="用户访问层" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1;fontColor=#1a1a2e;" vertex="1" parent="1">
+          <mxGeometry x="800" y="20" width="120" height="30" as="geometry" />
+        </mxCell>
+        <mxCell id="browser" value="浏览器&#xa;(Browser)" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#e3f2fd;strokeColor=#1976d2;fontColor=#0d47a1;" vertex="1" parent="1">
+          <mxGeometry x="860" y="60" width="120" height="50" as="geometry" />
+        </mxCell>
+
+        <!-- 前端展示层 -->
+        <mxCell id="layer2" value="前端展示层" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1;fontColor=#1a1a2e;" vertex="1" parent="1">
+          <mxGeometry x="800" y="140" width="120" height="30" as="geometry" />
+        </mxCell>
+        <mxCell id="frontend_box" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#f3e5f5;strokeColor=#7b1fa2;strokeWidth=2;" vertex="1" parent="1">
+          <mxGeometry x="200" y="180" width="1520" height="140" as="geometry" />
+        </mxCell>
+        <mxCell id="frontend_title" value="React 18 + TypeScript + Vite + shadcn/ui" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=14;fontStyle=1;fontColor=#4a148c;" vertex="1" parent="1">
+          <mxGeometry x="760" y="185" width="280" height="25" as="geometry" />
+        </mxCell>
+        <mxCell id="dashboard" value="Dashboard&#xa;首页仪表盘" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#ce93d8;strokeColor=#8e24aa;fontColor=#fff;" vertex="1" parent="1">
+          <mxGeometry x="240" y="220" width="120" height="80" as="geometry" />
+        </mxCell>
+        <mxCell id="documents" value="Documents&#xa;文档管理" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#ce93d8;strokeColor=#8e24aa;fontColor=#fff;" vertex="1" parent="1">
+          <mxGeometry x="400" y="220" width="120" height="80" as="geometry" />
+        </mxCell>
+        <mxCell id="template" value="TemplateFill&#xa;智能填表" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#ce93d8;strokeColor=#8e24aa;fontColor=#fff;" vertex="1" parent="1">
+          <mxGeometry x="560" y="220" width="120" height="80" as="geometry" />
+        </mxCell>
+        <mxCell id="instruction" value="Instruction&#xa;指令助手" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#ce93d8;strokeColor=#8e24aa;fontColor=#fff;" vertex="1" parent="1">
+          <mxGeometry x="720" y="220" width="120" height="80" as="geometry" />
+        </mxCell>
+        <mxCell id="taskhistory" value="TaskHistory&#xa;任务历史" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#ce93d8;strokeColor=#8e24aa;fontColor=#fff;" vertex="1" parent="1">
+          <mxGeometry x="880" y="220" width="120" height="80" as="geometry" />
+        </mxCell>
+        <mxCell id="frontend_libs" value="Recharts + Lucide Icons + React Router" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=11;fontColor=#6a1b9a;" vertex="1" parent="1">
+          <mxGeometry x="1040" y="250" width="280" height="25" as="geometry" />
+        </mxCell>
+
+        <!-- 连接线：浏览器到前端 -->
+        <mxCell id="conn1" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;strokeColor=#1976d2;strokeWidth=2;" edge="1" parent="1" source="browser" target="frontend_box">
+          <mxGeometry relative="1" as="geometry" />
+        </mxCell>
+
+        <!-- 后端服务层 -->
+        <mxCell id="layer3" value="后端服务层" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1;fontColor=#1a1a2e;" vertex="1" parent="1">
+          <mxGeometry x="800" y="350" width="120" height="30" as="geometry" />
+        </mxCell>
+        <mxCell id="backend_box" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#e8f5e9;strokeColor=#388e3c;strokeWidth=2;" vertex="1" parent="1">
+          <mxGeometry x="200" y="390" width="1520" height="180" as="geometry" />
+        </mxCell>
+        <mxCell id="backend_title" value="FastAPI + Uvicorn + Celery" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=14;fontStyle=1;fontColor=#1b5e20;" vertex="1" parent="1">
+          <mxGeometry x="800" y="395" width="200" height="25" as="geometry" />
+        </mxCell>
+        <mxCell id="upload" value="文档上传&#xa;/upload/*" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#81c784;strokeColor=#2e7d32;fontColor=#1b5e20;" vertex="1" parent="1">
+          <mxGeometry x="240" y="430" width="140" height="60" as="geometry" />
+        </mxCell>
+        <mxCell id="ai" value="AI分析&#xa;/ai/*" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#81c784;strokeColor=#2e7d32;fontColor=#1b5e20;" vertex="1" parent="1">
+          <mxGeometry x="420" y="430" width="140" height="60" as="geometry" />
+        </mxCell>
+        <mxCell id="rag" value="RAG检索&#xa;/rag/*" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#81c784;strokeColor=#2e7d32;fontColor=#1b5e20;" vertex="1" parent="1">
+          <mxGeometry x="600" y="430" width="140" height="60" as="geometry" />
+        </mxCell>
+        <mxCell id="template_api" value="模板填充&#xa;/templates/*" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#81c784;strokeColor=#2e7d32;fontColor=#1b5e20;" vertex="1" parent="1">
+          <mxGeometry x="780" y="430" width="140" height="60" as="geometry" />
+        </mxCell>
+        <mxCell id="instruction_api" value="指令解析&#xa;/instruction/*" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#81c784;strokeColor=#2e7d32;fontColor=#1b5e20;" vertex="1" parent="1">
+          <mxGeometry x="960" y="430" width="140" height="60" as="geometry" />
+        </mxCell>
+        <mxCell id="visualization" value="可视化&#xa;/visualization/*" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#81c784;strokeColor=#2e7d32;fontColor=#1b5e20;" vertex="1" parent="1">
+          <mxGeometry x="1140" y="430" width="140" height="60" as="geometry" />
+        </mxCell>
+        <mxCell id="celery" value="Celery&#xa;任务调度" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#a5d6a7;strokeColor=#2e7d32;fontColor=#1b5e20;" vertex="1" parent="1">
+          <mxGeometry x="1320" y="430" width="120" height="60" as="geometry" />
+        </mxCell>
+        <mxCell id="logging" value="监控日志" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#a5d6a7;strokeColor=#2e7d32;fontColor=#1b5e20;" vertex="1" parent="1">
+          <mxGeometry x="1480" y="430" width="100" height="60" as="geometry" />
+        </mxCell>
+
+        <!-- 连接线：前端到后端 -->
+        <mxCell id="conn2" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;strokeColor=#388e3c;strokeWidth=2;dashed=1;dashPattern=8 8;" edge="1" parent="1" source="frontend_box" target="backend_box">
+          <mxGeometry relative="1" as="geometry" />
+        </mxCell>
+
+        <!-- AI服务层 -->
+        <mxCell id="layer4" value="AI服务层" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1;fontColor=#1a1a2e;" vertex="1" parent="1">
+          <mxGeometry x="800" y="600" width="120" height="30" as="geometry" />
+        </mxCell>
+        <mxCell id="ai_box" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#fff3e0;strokeColor=#f57c00;strokeWidth=2;" vertex="1" parent="1">
+          <mxGeometry x="300" y="640" width="1320" height="120" as="geometry" />
+        </mxCell>
+        <mxCell id="llm_title" value="LLMService - 大模型服务" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=14;fontStyle=1;fontColor=#e65100;" vertex="1" parent="1">
+          <mxGeometry x="820" y="645" width="200" height="25" as="geometry" />
+        </mxCell>
+        <mxCell id="minimax" value="MiniMax-Text-01" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#ffcc80;strokeColor=#ef6c00;fontColor=#e65100;" vertex="1" parent="1">
+          <mxGeometry x="400" y="680" width="150" height="50" as="geometry" />
+        </mxCell>
+        <mxCell id="deepseek" value="DeepSeek-chat" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#ffcc80;strokeColor=#ef6c00;fontColor=#e65100;" vertex="1" parent="1">
+          <mxGeometry x="600" y="680" width="150" height="50" as="geometry" />
+        </mxCell>
+        <mxCell id="excel_ai" value="ExcelAIService" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#ffe0b2;strokeColor=#f57c00;fontColor=#e65100;" vertex="1" parent="1">
+          <mxGeometry x="820" y="680" width="130" height="50" as="geometry" />
+        </mxCell>
+        <mxCell id="word_ai" value="WordAIService" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#ffe0b2;strokeColor=#f57c00;fontColor=#e65100;" vertex="1" parent="1">
+          <mxGeometry x="980" y="680" width="130" height="50" as="geometry" />
+        </mxCell>
+        <mxCell id="md_ai" value="MarkdownAIService" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#ffe0b2;strokeColor=#f57c00;fontColor=#e65100;" vertex="1" parent="1">
+          <mxGeometry x="1140" y="680" width="130" height="50" as="geometry" />
+        </mxCell>
+        <mxCell id="txt_ai" value="TxtAIService" style="rounded=0;whiteSpace=wrap;html=1;fillColor=#ffe0b2;strokeColor=#f57c00;fontColor=#e65100;" vertex="1" parent="1">
+          <mxGeometry x="1300" y="680" width="130" height="50" as="geometry" />
+        </mxCell>
+
+        <!-- 连接线：后端到AI -->
+        <mxCell id="conn3" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;strokeColor=#f57c00;strokeWidth=2;dashed=1;dashPattern=8 8;" edge="1" parent="1" source="backend_box" target="ai_box">
+          <mxGeometry relative="1" as="geometry" />
+        </mxCell>
+
+        <!-- 数据存储层 -->
+        <mxCell id="layer5" value="数据存储层" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1;fontColor=#1a1a2e;" vertex="1" parent="1">
+          <mxGeometry x="800" y="790" width="120" height="30" as="geometry" />
+        </mxCell>
+        <mxCell id="mongodb" value="MongoDB&#xa;文档数据库&#xa;&#xa;• 原始文档内容&#xa;• 元数据信息&#xa;• 文档标签&#xa;• 处理状态" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#e0e0e0;strokeColor=#616161;fontColor=#212121;align=left;spacingLeft=10;" vertex="1" parent="1">
+          <mxGeometry x="240" y="830" width="200" height="160" as="geometry" />
+        </mxCell>
+        <mxCell id="mysql" value="MySQL&#xa;关系数据库&#xa;&#xa;• Excel表格数据&#xa;• 结构化数据&#xa;• 字段描述&#xa;• RAG索引" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#e0e0e0;strokeColor=#616161;fontColor=#212121;align=left;spacingLeft=10;" vertex="1" parent="1">
+          <mxGeometry x="520" y="830" width="200" height="160" as="geometry" />
+        </mxCell>
+        <mxCell id="redis" value="Redis&#xa;缓存/队列&#xa;&#xa;• 会话缓存&#xa;• 任务队列&#xa;• Celery broker&#xa;• 临时数据" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#e0e0e0;strokeColor=#616161;fontColor=#212121;align=left;spacingLeft=10;" vertex="1" parent="1">
+          <mxGeometry x="800" y="830" width="200" height="160" as="geometry" />
+        </mxCell>
+        <mxCell id="faiss" value="FAISS&#xa;向量数据库&#xa;&#xa;• 文档向量索引&#xa;• 语义相似度&#xa;• RAG检索&#xa;• sentence-transformers" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#e0e0e0;strokeColor=#616161;fontColor=#212121;align=left;spacingLeft=10;" vertex="1" parent="1">
+          <mxGeometry x="1080" y="830" width="240" height="160" as="geometry" />
+        </mxCell>
+
+        <!-- 连接线：AI到存储 -->
+        <mxCell id="conn4" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;strokeColor=#616161;strokeWidth=2;dashed=1;dashPattern=8 8;" edge="1" parent="1" source="ai_box" target="mongodb">
+          <mxGeometry relative="1" as="geometry" />
+        </mxCell>
+        <mxCell id="conn5" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;strokeColor=#616161;strokeWidth=2;dashed=1;dashPattern=8 8;" edge="1" parent="1" source="ai_box" target="mysql">
+          <mxGeometry relative="1" as="geometry" />
+        </mxCell>
+        <mxCell id="conn6" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;strokeColor=#616161;strokeWidth=2;dashed=1;dashPattern=8 8;" edge="1" parent="1" source="ai_box" target="redis">
+          <mxGeometry relative="1" as="geometry" />
+        </mxCell>
+        <mxCell id="conn7" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;strokeColor=#616161;strokeWidth=2;dashed=1;dashPattern=8 8;" edge="1" parent="1" source="ai_box" target="faiss">
+          <mxGeometry relative="1" as="geometry" />
+        </mxCell>
+
+        <!-- 标注 -->
+        <mxCell id="arrow1" value="HTTP/HTTPS&#xa;WebSocket" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=10;fontColor=#1976d2;" vertex="1" parent="1">
+          <mxGeometry x="1020" y="130" width="80" height="30" as="geometry" />
+        </mxCell>
+        <mxCell id="arrow2" value="API调用" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=10;fontColor=#388e3c;" vertex="1" parent="1">
+          <mxGeometry x="1020" y="570" width="60" height="20" as="geometry" />
+        </mxCell>
+        <mxCell id="arrow3" value="数据读写" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=10;fontColor=#616161;" vertex="1" parent="1">
+          <mxGeometry x="1020" y="770" width="60" height="20" as="geometry" />
+        </mxCell>
+
+      </root>
+    </mxGraphModel>
+  </diagram>
+</mxfile>
--- a/frontend/Dockerfile
+++ b/frontend/Dockerfile
@@ -0,0 +1,36 @@
+# ============================================================
+# FilesReadSystem Frontend - React + Vite
+# 多阶段构建: Node 构建 -> Nginx 运行
+# ============================================================
+
+# === 阶段1: 构建阶段 ===
+FROM node:20-alpine AS builder
+
+WORKDIR /app
+
+# 复制 package 文件和锁文件
+COPY package.json pnpm-lock.yaml* ./
+
+# 安装 pnpm 并安装依赖
+RUN npm install -g pnpm && \
+    pnpm install --frozen-lockfile
+
+# 复制源码
+COPY . .
+
+# 构建生产版本
+RUN pnpm build
+
+# === 阶段2: 运行阶段 ===
+FROM nginx:alpine
+
+# 复制 nginx 配置
+COPY nginx.conf /etc/nginx/conf.d/default.conf
+
+# 复制构建产物
+COPY --from=builder /app/dist /usr/share/nginx/html
+
+# 暴露端口
+EXPOSE 80
+
+CMD ["nginx", "-g", "daemon off;"]
--- a/frontend/nginx.conf
+++ b/frontend/nginx.conf
@@ -0,0 +1,47 @@
+# ============================================================
+# FilesReadSystem Nginx 配置
+# 反向代理 API 请求到后端
+# ============================================================
+
+server {
+    listen 80;
+    server_name localhost;
+
+    # 前端静态文件
+    root /usr/share/nginx/html;
+    index index.html;
+
+    # SPA 支持 - 所有请求都尝试返回 index.html
+    location / {
+        try_files $uri $uri/ /index.html;
+    }
+
+    # 静态资源缓存
+    location ~* \.(js|css|png|jpg|jpeg|gif|ico|svg|woff|woff2|ttf|eot)$ {
+        expires 1y;
+        add_header Cache-Control "public, immutable";
+    }
+
+    # API 反向代理到后端
+    location /api/ {
+        proxy_pass http://backend:8000/api/;
+        proxy_http_version 1.1;
+        proxy_set_header Host $host;
+        proxy_set_header X-Real-IP $remote_addr;
+        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
+        proxy_set_header X-Forwarded-Proto $scheme;
+
+        # 超时设置
+        proxy_connect_timeout 60s;
+        proxy_send_timeout 60s;
+        proxy_read_timeout 60s;
+    }
+
+    # 文件上传代理
+    location /uploads/ {
+        proxy_pass http://backend:8000/uploads/;
+        proxy_set_header Host $host;
+        proxy_set_header X-Real-IP $remote_addr;
+        client_max_body_size 100M;
+    }
+}
--- a/frontend/src/components/layouts/MainLayout.tsx
+++ b/frontend/src/components/layouts/MainLayout.tsx
@@ -8,7 +8,8 @@ import {
  Menu,
  ChevronRight,
  Sparkles,
-  Clock
+  Clock,
+  FileDown
 } from 'lucide-react';
 import { Button } from '@/components/ui/button';
 import { cn } from '@/lib/utils';
@@ -19,6 +20,7 @@ const navItems = [
  { name: '文档中心', path: '/documents', icon: FileText },
  { name: '智能填表', path: '/form-fill', icon: TableProperties },
  { name: '智能助手', path: '/assistant', icon: MessageSquareCode },
+  { name: '文档转PDF', path: '/pdf-converter', icon: FileDown },
  { name: '任务历史', path: '/task-history', icon: Clock },
 ];

@@ -32,7 +34,7 @@ const MainLayout: React.FC = () => {
          <FileText size={24} />
        </div>
        <div className="flex flex-col">
-          <span className="font-bold text-lg tracking-tight text-sidebar-foreground">智联文档</span>
+          <span className="font-bold text-lg tracking-tight text-sidebar-foreground">表易智融</span>
          <span className="text-xs text-muted-foreground">多源数据融合平台</span>
        </div>
      </div>
@@ -66,7 +68,7 @@ const MainLayout: React.FC = () => {
              <Sparkles size={20} className="text-primary" />
            </div>
            <div className="flex flex-col overflow-hidden">
-              <span className="font-semibold text-sm truncate">智联文档</span>
+              <span className="font-semibold text-sm truncate">表易智融</span>
              <span className="text-[10px] uppercase tracking-wider text-muted-foreground">多源数据融合</span>
            </div>
          </div>
--- a/frontend/src/db/backend-api.ts
+++ b/frontend/src/db/backend-api.ts
@@ -1153,6 +1153,120 @@ export const backendApi = {
    }
  },

+  // ==================== PDF 转换 API ====================
+
+  /**
+   * 将文件转换为 PDF
+   */
+  /**
+   * PDF转换并直接下载（使用XHR，支持IDM拦截）
+   */
+  async convertAndDownloadPdf(file: File): Promise<void> {
+    return new Promise((resolve, reject) => {
+      const xhr = new XMLHttpRequest();
+      xhr.open('POST', `${BACKEND_BASE_URL}/pdf/convert`);
+
+      xhr.onload = function() {
+        if (xhr.status >= 200 && xhr.status < 300) {
+          // 创建 blob 并触发下载
+          const blob = xhr.response;
+          const url = URL.createObjectURL(blob);
+          const a = document.createElement('a');
+          a.href = url;
+          a.download = `${file.name.replace(/\.[^.]+$/, '')}.pdf`;
+          document.body.appendChild(a);
+          a.click();
+          document.body.removeChild(a);
+          URL.revokeObjectURL(url);
+          resolve();
+        } else {
+          reject(new Error(`转换失败: ${xhr.status}`));
+        }
+      };
+
+      xhr.onerror = function() {
+        reject(new Error('网络错误'));
+      };
+
+      const formData = new FormData();
+      formData.append('file', file);
+      xhr.responseType = 'blob';
+      xhr.send(formData);
+    });
+  },
+
+  /**
+   * PDF转换（返回Blob）
+   */
+  async convertToPdf(file: File): Promise<Blob> {
+    return new Promise((resolve, reject) => {
+      const xhr = new XMLHttpRequest();
+      xhr.open('POST', `${BACKEND_BASE_URL}/pdf/convert`);
+
+      xhr.onload = function() {
+        if (xhr.status >= 200 && xhr.status < 300) {
+          resolve(xhr.response);
+        } else {
+          reject(new Error(`转换失败: ${xhr.status}`));
+        }
+      };
+
+      xhr.onerror = function() {
+        reject(new Error('网络错误'));
+      };
+
+      const formData = new FormData();
+      formData.append('file', file);
+      xhr.responseType = 'blob';
+      xhr.send(formData);
+    });
+  },
+
+  /**
+   * 批量将文件转换为 PDF
+   */
+  async batchConvertToPdf(files: File[]): Promise<Blob> {
+    const formData = new FormData();
+    files.forEach(file => formData.append('files', file));
+
+    const url = `${BACKEND_BASE_URL}/pdf/convert/batch`;
+
+    try {
+      const response = await fetch(url, {
+        method: 'POST',
+        body: formData,
+      });
+
+      if (!response.ok) {
+        const error = await response.json();
+        throw new Error(error.detail || '批量PDF转换失败');
+      }
+
+      return await response.blob();
+    } catch (error) {
+      console.error('批量PDF转换失败:', error);
+      throw error;
+    }
+  },
+
+  /**
+   * 获取支持的 PDF 转换格式
+   */
+  async getPdfSupportedFormats(): Promise<{
+    success: boolean;
+    formats: string[];
+  }> {
+    const url = `${BACKEND_BASE_URL}/pdf/formats`;
+
+    try {
+      const response = await fetch(url);
+      if (!response.ok) throw new Error('获取支持的格式失败');
+      return await response.json();
+    } catch (error) {
+      console.error('获取支持的格式失败:', error);
+      return { success: false, formats: ['docx', 'xlsx', 'txt', 'md'] };
+    }
+  }
 };

 // ==================== AI 分析 API ====================
@@ -1187,11 +1301,19 @@ export const aiApi = {
   * 上传并使用 AI 分析 Excel 文件
   */
  async analyzeExcel(
-    file: File,
-    options: AIAnalyzeOptions = {}
+    file: File | null,
+    options: AIAnalyzeOptions = {},
+    docId: string | null = null
  ): Promise<AIExcelAnalyzeResult> {
    const formData = new FormData();
-    formData.append('file', file);
+
+    if (docId) {
+      formData.append('doc_id', docId);
+    } else if (file) {
+      formData.append('file', file);
+    } else {
+      throw new Error('必须提供文件或文档ID');
+    }

    const params = new URLSearchParams();
    if (options.userPrompt) {
@@ -1268,7 +1390,9 @@ export const aiApi = {
    try {
      const response = await fetch(url);
      if (!response.ok) throw new Error('获取分析类型失败');
-      return await response.json();
+      const data = await response.json();
+      // 转换后端返回格式 {excel_types: [], markdown_types: []} 为前端期望的 {types: []}
+      return { types: data.excel_types || [] };
    } catch (error) {
      console.error('获取分析类型失败:', error);
      throw error;
@@ -1795,5 +1919,6 @@ export const aiApi = {
      console.error('获取会话列表失败:', error);
      return { success: false, conversations: [] };
    }
-  }
+  },
+
 };
--- a/frontend/src/pages/Assistant.tsx
+++ b/frontend/src/pages/Assistant.tsx
@@ -41,7 +41,7 @@ const Assistant: React.FC = () => {
        {
          id: '1',
          role: 'assistant',
-          content: '您好！我是智联文档 AI 助手。您可以告诉我您想对文档进行的操作，例如：\n- "帮我列出最近上传的所有 docx 文档"\n- "从 2026 财报文档中提取出关键的利润数据"\n- "帮我创建一个汇总各部门报销单的填表任务"\n\n请问有什么我可以帮您的？',
+          content: '您好！我是表易智融 AI 助手。您可以告诉我您想对文档进行的操作，例如：\n- "帮我列出最近上传的所有 docx 文档"\n- "从 2026 财报文档中提取出关键的利润数据"\n- "帮我创建一个汇总各部门报销单的填表任务"\n\n请问有什么我可以帮您的？',
          created_at: new Date().toISOString()
        }
      ]);
--- a/frontend/src/pages/Dashboard.tsx
+++ b/frontend/src/pages/Dashboard.tsx
@@ -89,7 +89,7 @@ const Dashboard: React.FC = () => {
      <section className="flex flex-col md:flex-row md:items-center justify-between gap-4">
        <div className="space-y-1">
          <h1 className="text-3xl font-extrabold tracking-tight">
-            欢迎使用 <span className="text-primary">智联文档</span> 系统 👋
+            欢迎使用 <span className="text-primary">表易智融</span> 系统 👋
          </h1>
          <p className="text-muted-foreground">基于大语言模型的文档理解与多源数据融合系统</p>
        </div>
--- a/frontend/src/pages/Documents.tsx
+++ b/frontend/src/pages/Documents.tsx
@@ -472,11 +472,17 @@ const Documents: React.FC = () => {
    setAnalysisCharts(null);

    try {
-      const result = await aiApi.analyzeExcel(uploadedFile, {
-        userPrompt: aiOptions.userPrompt,
-        analysisType: aiOptions.analysisType,
-        parseAllSheets: aiOptions.parseAllSheetsForAI
-      });
+      // 判断是从历史文档还是本地上传
+      const docId = selectedDocument?.doc_id && uploadedFile.size === 0 ? selectedDocument.doc_id : null;
+      const result = await aiApi.analyzeExcel(
+        uploadedFile.size > 0 ? uploadedFile : null,
+        {
+          userPrompt: aiOptions.userPrompt,
+          analysisType: aiOptions.analysisType,
+          parseAllSheets: aiOptions.parseAllSheetsForAI
+        },
+        docId
+      );

      if (result.success) {
        toast.success('AI 分析完成');
@@ -706,6 +712,12 @@ const Documents: React.FC = () => {

  const handleSelectDocument = async (docId: string) => {
    setLoadingDocument(true);
+    // 重置所有 AI 分析结果，避免显示上一个文档的分析
+    setAiAnalysis(null);
+    setAnalysisCharts(null);
+    setMdAnalysis(null);
+    setWordAnalysis(null);
+    setTxtAnalysis(null);
    try {
      const result = await backendApi.getDocument(docId);
      if (result.success && result.document) {
@@ -2264,39 +2276,57 @@ const Documents: React.FC = () => {
  );
 };

-// 数据表格组件
+// 数据表格组件 - 滑动窗口样式
 const DataTable: React.FC<{ columns: string[]; rows: Record<string, any>[] }> = ({ columns, rows }) => {
  if (!columns.length || !rows.length) {
    return <div className="text-center py-8 text-muted-foreground text-sm">暂无数据</div>;
  }

+  const displayRows = rows.slice(0, 500); // 限制最多显示500行
+
  return (
-    <div className="rounded-lg border overflow-x-auto">
-      <TableComponent>
-        <TableHeader>
-          <TableRow>
-            <TableHead className="w-16 text-center text-muted-foreground">#</TableHead>
-            {columns.map((col, idx) => (
-              <TableHead key={idx} className="whitespace-nowrap">{col || `<列${idx + 1}>`}</TableHead>
-            ))}
-          </TableRow>
-        </TableHeader>
-        <TableBody>
-          {rows.slice(0, 100).map((row, rowIdx) => (
-            <TableRow key={rowIdx}>
-              <TableCell className="text-center text-muted-foreground font-medium">{rowIdx + 1}</TableCell>
-              {columns.map((col, colIdx) => (
-                <TableCell key={colIdx} className="whitespace-nowrap">
-                  {row[col] !== null && row[col] !== undefined ? String(row[col]) : '-'}
-                </TableCell>
+    <div className="rounded-lg border overflow-hidden">
+      {/* 表头 - 固定 */}
+      <div className="overflow-x-auto">
+        <TableComponent>
+          <TableHeader>
+            <TableRow className="bg-muted/50">
+              <TableHead className="w-16 text-center text-muted-foreground">#</TableHead>
+              {columns.map((col, idx) => (
+                <TableHead key={idx} className="whitespace-nowrap">{col || `<列${idx + 1}>`}</TableHead>
              ))}
            </TableRow>
-          ))}
-        </TableBody>
-      </TableComponent>
-      {rows.length > 100 && (
+          </TableHeader>
+        </TableComponent>
+      </div>
+      {/* 表体 - 可滚动 */}
+      <div
+        className="overflow-y-auto"
+        style={{ maxHeight: '400px' }}
+      >
+        <TableComponent>
+          <TableBody>
+            {displayRows.map((row, rowIdx) => (
+              <TableRow key={rowIdx}>
+                <TableCell className="text-center text-muted-foreground font-medium w-16">{rowIdx + 1}</TableCell>
+                {columns.map((col, colIdx) => (
+                  <TableCell key={colIdx} className="whitespace-nowrap">
+                    {row[col] !== null && row[col] !== undefined ? String(row[col]) : '-'}
+                  </TableCell>
+                ))}
+              </TableRow>
+            ))}
+          </TableBody>
+        </TableComponent>
+      </div>
+      {rows.length > 500 && (
        <div className="p-3 text-center text-sm text-muted-foreground bg-muted/30">
-          仅显示前 100 行数据
+          仅显示前 500 行数据（共 {rows.length} 行）
+        </div>
+      )}
+      {rows.length > 100 && rows.length <= 500 && (
+        <div className="p-2 text-center text-xs text-muted-foreground bg-muted/20">
+          共 {rows.length} 行数据，向下滚动查看更多
        </div>
      )}
    </div>
--- a/frontend/src/pages/InstructionChat.tsx
+++ b/frontend/src/pages/InstructionChat.tsx
@@ -45,7 +45,7 @@ const InstructionChat: React.FC = () => {
        {
          id: 'welcome',
          role: 'assistant',
-          content: `您好！我是智联文档 AI 助手。
+          content: `您好！我是表易智融 AI 助手。

 **📄 文档智能操作**
 - "提取文档中的医院数量和床位数"
--- a/frontend/src/pages/PdfConverter.tsx
+++ b/frontend/src/pages/PdfConverter.tsx
@@ -0,0 +1,446 @@
+/**
+ * PDF 转换页面
+ * 支持将 Word、Excel、Txt、Markdown 格式转换为 PDF
+ */
+import React, { useState, useCallback } from 'react';
+import { useDropzone } from 'react-dropzone';
+import {
+  FileText,
+  Upload,
+  Download,
+  FileSpreadsheet,
+  File as FileIcon,
+  Loader2,
+  CheckCircle,
+  AlertCircle,
+  Trash2,
+  FileDown,
+  X,
+  Copy
+} from 'lucide-react';
+import { Button } from '@/components/ui/button';
+import { Card, CardContent, CardHeader, CardTitle, CardDescription } from '@/components/ui/card';
+import { Badge } from '@/components/ui/badge';
+import { Label } from '@/components/ui/label';
+import { toast } from 'sonner';
+import { cn } from '@/lib/utils';
+import { backendApi } from '@/db/backend-api';
+
+type FileState = {
+  file: File;
+  status: 'pending' | 'converting' | 'success' | 'failed';
+  progress: number;
+  pdfBlob?: Blob;
+  error?: string;
+};
+
+const SUPPORTED_FORMATS = [
+  { ext: 'docx', name: 'Word 文档', icon: FileText, color: 'blue' },
+  { ext: 'xlsx', name: 'Excel 表格', icon: FileSpreadsheet, color: 'emerald' },
+  { ext: 'txt', name: '文本文件', icon: FileIcon, color: 'gray' },
+  { ext: 'md', name: 'Markdown', icon: FileText, color: 'purple' },
+];
+
+const PdfConverter: React.FC = () => {
+  const [files, setFiles] = useState<FileState[]>([]);
+  const [converting, setConverting] = useState(false);
+  const [convertedCount, setConvertedCount] = useState(0);
+
+  const onDrop = useCallback((acceptedFiles: File[]) => {
+    const newFiles: FileState[] = acceptedFiles.map(file => ({
+      file,
+      status: 'pending',
+      progress: 0,
+    }));
+    setFiles(prev => [...prev, ...newFiles]);
+  }, []);
+
+  const { getRootProps, getInputProps, isDragActive } = useDropzone({
+    onDrop,
+    accept: {
+      'application/vnd.openxmlformats-officedocument.wordprocessingml.document': ['.docx'],
+      'application/vnd.openxmlformats-officedocument.spreadsheetml.sheet': ['.xlsx'],
+      'application/vnd.ms-excel': ['.xls'],
+      'text/markdown': ['.md'],
+      'text/plain': ['.txt'],
+    },
+    multiple: true,
+  });
+
+  const handleConvert = async () => {
+    if (files.length === 0) {
+      toast.error('请先上传文件');
+      return;
+    }
+
+    setConverting(true);
+    setConvertedCount(0);
+
+    const pendingFiles = files.filter(f => f.status === 'pending' || f.status === 'failed');
+    let successCount = 0;
+
+    for (let i = 0; i < pendingFiles.length; i++) {
+      const fileState = pendingFiles[i];
+      const fileIndex = files.findIndex(f => f.file === fileState.file);
+
+      // 更新状态为转换中
+      setFiles(prev => prev.map((f, idx) =>
+        idx === fileIndex ? { ...f, status: 'converting', progress: 10 } : f
+      ));
+
+      try {
+        // 获取 PDF blob
+        const pdfBlob = await backendApi.convertToPdf(fileState.file);
+
+        // 触发下载
+        const url = URL.createObjectURL(pdfBlob);
+        const a = document.createElement('a');
+        a.href = url;
+        a.download = `${fileState.file.name.replace(/\.[^.]+$/, '')}.pdf`;
+        document.body.appendChild(a);
+        a.click();
+        document.body.removeChild(a);
+        URL.revokeObjectURL(url);
+
+        // 保存 blob 以便批量下载
+        setFiles(prev => prev.map((f, idx) =>
+          idx === fileIndex ? { ...f, status: 'success', progress: 100, pdfBlob } : f
+        ));
+        successCount++;
+        setConvertedCount(successCount);
+        toast.success(`${fileState.file.name} 下载已开始`);
+      } catch (error: any) {
+        setFiles(prev => prev.map((f, idx) =>
+          idx === fileIndex ? { ...f, status: 'failed', error: error.message || '转换失败' } : f
+        ));
+      }
+    }
+
+    setConverting(false);
+    toast.success(`转换完成：${successCount}/${pendingFiles.length} 个文件`);
+  };
+
+  const handleDownload = (fileState: FileState) => {
+    if (!fileState.pdfBlob) return;
+
+    const url = URL.createObjectURL(fileState.pdfBlob);
+    const link = document.createElement('a');
+    link.href = url;
+    link.download = `${fileState.file.name.replace(/\.[^.]+$/, '')}.pdf`;
+    document.body.appendChild(link);
+    link.click();
+    document.body.removeChild(link);
+    URL.revokeObjectURL(url);
+  };
+
+  const handleDownloadAll = async () => {
+    const successFiles = files.filter(f => f.status === 'success' && f.pdfBlob);
+
+    if (successFiles.length === 0) {
+      toast.error('没有可下载的文件');
+      return;
+    }
+
+    if (successFiles.length === 1) {
+      handleDownload(successFiles[0]);
+      return;
+    }
+
+    // 多个文件，下载 ZIP
+    try {
+      const zipBlob = await backendApi.batchConvertToPdf(
+        successFiles.map(f => f.file)
+      );
+      const url = URL.createObjectURL(zipBlob);
+      const link = document.createElement('a');
+      link.href = url;
+      link.download = 'converted_pdfs.zip';
+      document.body.appendChild(link);
+      link.click();
+      document.body.removeChild(link);
+      URL.revokeObjectURL(url);
+      toast.success('ZIP 下载开始');
+    } catch (error: any) {
+      toast.error(error.message || '下载失败');
+    }
+  };
+
+  const handleRemove = (index: number) => {
+    setFiles(prev => prev.filter((_, i) => i !== index));
+  };
+
+  const handleClear = () => {
+    setFiles([]);
+    setConvertedCount(0);
+  };
+
+  const getFileIcon = (filename: string) => {
+    const ext = filename.split('.').pop()?.toLowerCase();
+    const format = SUPPORTED_FORMATS.find(f => f.ext === ext);
+    if (!format) return FileIcon;
+    return format.icon;
+  };
+
+  const getFileColor = (filename: string) => {
+    const ext = filename.split('.').pop()?.toLowerCase();
+    const format = SUPPORTED_FORMATS.find(f => f.ext === ext);
+    return format?.color || 'gray';
+  };
+
+  const colorClasses: Record<string, string> = {
+    blue: 'bg-blue-500/10 text-blue-500',
+    emerald: 'bg-emerald-500/10 text-emerald-500',
+    purple: 'bg-purple-500/10 text-purple-500',
+    gray: 'bg-gray-500/10 text-gray-500',
+  };
+
+  return (
+    <div className="space-y-8 pb-10">
+      <section className="flex flex-col md:flex-row md:items-center justify-between gap-4">
+        <div className="space-y-1">
+          <h1 className="text-3xl font-extrabold tracking-tight">文档转 PDF</h1>
+          <p className="text-muted-foreground">将 Word、Excel、文本、Markdown 文件转换为 PDF 格式</p>
+        </div>
+        {files.length > 0 && (
+          <div className="flex gap-2">
+            <Button variant="outline" onClick={handleClear}>
+              <Trash2 size={18} className="mr-2" />
+              清空
+            </Button>
+            <Button onClick={handleDownloadAll} disabled={files.filter(f => f.status === 'success').length === 0}>
+              <Download size={18} className="mr-2" />
+              打包下载 ({files.filter(f => f.status === 'success').length})
+            </Button>
+          </div>
+        )}
+      </section>
+
+      <div className="grid grid-cols-1 lg:grid-cols-3 gap-6">
+        {/* 左侧：上传区域 */}
+        <div className="lg:col-span-1 space-y-6">
+          {/* 上传卡片 */}
+          <Card className="border-none shadow-md">
+            <CardHeader className="pb-4">
+              <CardTitle className="flex items-center gap-2">
+                <Upload className="text-primary" size={20} />
+                上传文件
+              </CardTitle>
+              <CardDescription>拖拽或点击上传要转换的文件</CardDescription>
+            </CardHeader>
+            <CardContent className="space-y-4">
+              <div
+                {...getRootProps()}
+                className={cn(
+                  "border-2 border-dashed rounded-2xl p-8 transition-all duration-300 flex flex-col items-center justify-center text-center cursor-pointer group",
+                  isDragActive ? "border-primary bg-primary/5" : "border-muted-foreground/20 hover:border-primary/50 hover:bg-primary/5",
+                  converting && "opacity-50 pointer-events-none"
+                )}
+              >
+                <input {...getInputProps()} />
+                <div className="w-14 h-14 rounded-xl bg-primary/10 text-primary flex items-center justify-center mb-4 group-hover:scale-110 transition-transform">
+                  {converting ? <Loader2 className="animate-spin" size={28} /> : <Upload size={28} />}
+                </div>
+                <p className="font-semibold text-sm">
+                  {isDragActive ? '释放以开始上传' : '点击或拖拽文件到这里'}
+                </p>
+                <div className="mt-4 flex flex-wrap justify-center gap-2">
+                  {SUPPORTED_FORMATS.map(format => (
+                    <Badge key={format.ext} variant="outline" className={cn("text-xs", colorClasses[format.color])}>
+                      {format.name}
+                    </Badge>
+                  ))}
+                </div>
+              </div>
+
+              {/* 转换按钮 */}
+              {files.length > 0 && (
+                <Button
+                  onClick={handleConvert}
+                  disabled={converting || files.filter(f => f.status === 'pending' || f.status === 'failed').length === 0}
+                  className="w-full bg-gradient-to-r from-primary to-purple-600 hover:from-primary/90 hover:to-purple-600/90"
+                >
+                  {converting ? (
+                    <>
+                      <Loader2 className="mr-2 animate-spin" size={16} />
+                      转换中... ({convertedCount}/{files.filter(f => f.status === 'pending' || f.status === 'failed').length})
+                    </>
+                  ) : (
+                    <>
+                      <FileDown className="mr-2" size={16} />
+                      开始转换 ({files.filter(f => f.status === 'pending' || f.status === 'failed').length})
+                    </>
+                  )}
+                </Button>
+              )}
+            </CardContent>
+          </Card>
+
+          {/* 格式说明 */}
+          <Card className="border-none shadow-md">
+            <CardHeader className="pb-4">
+              <CardTitle className="flex items-center gap-2">
+                <FileText className="text-primary" size={20} />
+                支持的格式
+              </CardTitle>
+            </CardHeader>
+            <CardContent>
+              <div className="space-y-3">
+                {SUPPORTED_FORMATS.map(format => {
+                  const Icon = format.icon;
+                  return (
+                    <div key={format.ext} className="flex items-center gap-3 p-2 rounded-lg hover:bg-muted/30 transition-colors">
+                      <div className={cn("w-8 h-8 rounded flex items-center justify-center", colorClasses[format.color])}>
+                        <Icon size={16} />
+                      </div>
+                      <div className="flex-1">
+                        <p className="text-sm font-medium">.{format.ext.toUpperCase()}</p>
+                        <p className="text-xs text-muted-foreground">{format.name}</p>
+                      </div>
+                    </div>
+                  );
+                })}
+              </div>
+            </CardContent>
+          </Card>
+        </div>
+
+        {/* 右侧：文件列表 */}
+        <div className="lg:col-span-2 space-y-6">
+          <Card className="border-none shadow-md">
+            <CardHeader>
+              <div className="flex items-center justify-between">
+                <div className="space-y-1">
+                  <CardTitle className="flex items-center gap-2">
+                    <FileIcon className="text-primary" size={20} />
+                    文件列表
+                  </CardTitle>
+                  <CardDescription>
+                    共 {files.length} 个文件，已转换 {files.filter(f => f.status === 'success').length} 个
+                  </CardDescription>
+                </div>
+              </div>
+            </CardHeader>
+            <CardContent>
+              {files.length === 0 ? (
+                <div className="text-center py-12 text-muted-foreground">
+                  <FileIcon size={48} className="mx-auto mb-4 opacity-30" />
+                  <p>暂无文件，上传文件开始转换</p>
+                </div>
+              ) : (
+                <div className="space-y-3">
+                  {files.map((fileState, index) => {
+                    const Icon = getFileIcon(fileState.file.name);
+                    const color = getFileColor(fileState.file.name);
+
+                    return (
+                      <div
+                        key={index}
+                        className="flex items-center gap-4 p-4 rounded-xl border bg-card hover:bg-muted/30 transition-colors"
+                      >
+                        <div className={cn("w-10 h-10 rounded-lg flex items-center justify-center shrink-0", colorClasses[color])}>
+                          <Icon size={20} />
+                        </div>
+                        <div className="flex-1 min-w-0">
+                          <p className="font-semibold truncate">{fileState.file.name}</p>
+                          <div className="flex items-center gap-2">
+                            <span className="text-xs text-muted-foreground">
+                              {(fileState.file.size / 1024).toFixed(1)} KB
+                            </span>
+                            {fileState.status === 'pending' && (
+                              <Badge variant="secondary" className="text-xs">待转换</Badge>
+                            )}
+                            {fileState.status === 'converting' && (
+                              <Badge variant="default" className="text-xs bg-blue-500">转换中</Badge>
+                            )}
+                            {fileState.status === 'success' && (
+                              <Badge variant="default" className="text-xs bg-emerald-500">已转换</Badge>
+                            )}
+                            {fileState.status === 'failed' && (
+                              <Badge variant="destructive" className="text-xs">失败</Badge>
+                            )}
+                          </div>
+                          {fileState.status === 'converting' && (
+                            <div className="mt-1 h-1 bg-muted rounded-full overflow-hidden">
+                              <div
+                                className="h-full bg-primary transition-all duration-300"
+                                style={{ width: `${fileState.progress}%` }}
+                              />
+                            </div>
+                          )}
+                          {fileState.error && (
+                            <p className="text-xs text-destructive mt-1">{fileState.error}</p>
+                          )}
+                        </div>
+                        <div className="flex items-center gap-2 shrink-0">
+                          {fileState.status === 'success' && (
+                            <>
+                              <Button variant="ghost" size="icon" onClick={() => handleDownload(fileState)}>
+                                <Download size={18} className="text-emerald-500" />
+                              </Button>
+                              <Button
+                                variant="ghost"
+                                size="icon"
+                                onClick={() => {
+                                  // 复制下载链接到剪贴板
+                                  if (fileState.pdfBlob) {
+                                    const url = URL.createObjectURL(fileState.pdfBlob);
+                                    navigator.clipboard.writeText(url);
+                                    toast.success('链接已复制');
+                                  }
+                                }}
+                              >
+                                <Copy size={18} />
+                              </Button>
+                            </>
+                          )}
+                          {(fileState.status === 'pending' || fileState.status === 'failed') && (
+                            <Button
+                              variant="ghost"
+                              size="icon"
+                              onClick={() => handleRemove(index)}
+                              className="text-destructive hover:bg-destructive/10"
+                            >
+                              <X size={18} />
+                            </Button>
+                          )}
+                        </div>
+                      </div>
+                    );
+                  })}
+                </div>
+              )}
+            </CardContent>
+          </Card>
+
+          {/* 使用说明 */}
+          <Card className="border-none shadow-md bg-gradient-to-br from-primary/5 to-purple-500/5">
+            <CardHeader className="pb-4">
+              <CardTitle className="flex items-center gap-2">
+                <FileText className="text-primary" size={20} />
+                使用说明
+              </CardTitle>
+            </CardHeader>
+            <CardContent>
+              <div className="space-y-3 text-sm text-muted-foreground">
+                <div className="flex gap-3">
+                  <div className="w-6 h-6 rounded-full bg-primary/10 text-primary flex items-center justify-center shrink-0 text-xs font-bold">1</div>
+                  <p>上传要转换的文件，支持 Word(.docx)、Excel(.xlsx)、文本(.txt)、Markdown(.md) 格式</p>
+                </div>
+                <div className="flex gap-3">
+                  <div className="w-6 h-6 rounded-full bg-primary/10 text-primary flex items-center justify-center shrink-0 text-xs font-bold">2</div>
+                  <p>点击「开始转换」按钮，系统将自动将文件转换为 PDF 格式</p>
+                </div>
+                <div className="flex gap-3">
+                  <div className="w-6 h-6 rounded-full bg-primary/10 text-primary flex items-center justify-center shrink-0 text-xs font-bold">3</div>
+                  <p>转换完成后，点击下载按钮获取 PDF 文件，或使用「打包下载」一次性下载所有文件</p>
+                </div>
+              </div>
+            </CardContent>
+          </Card>
+        </div>
+      </div>
+    </div>
+  );
+};
+
+export default PdfConverter;
--- a/frontend/src/routes.tsx
+++ b/frontend/src/routes.tsx
@@ -4,6 +4,7 @@ import Documents from '@/pages/Documents';
 import TemplateFill from '@/pages/TemplateFill';
 import InstructionChat from '@/pages/InstructionChat';
 import TaskHistory from '@/pages/TaskHistory';
+import PdfConverter from '@/pages/PdfConverter';
 import MainLayout from '@/components/layouts/MainLayout';

 export const routes = [
@@ -31,6 +32,10 @@ export const routes = [
        path: '/task-history',
        element: <TaskHistory />,
      },
+      {
+        path: '/pdf-converter',
+        element: <PdfConverter />,
+      },
    ],
  },
  {
--- a/frontend/tsconfig.app.json
+++ b/frontend/tsconfig.app.json
@@ -23,7 +23,6 @@
    "noUnusedParameters": true,
    "noFallthroughCasesInSwitch": true,
    "noUncheckedSideEffectImports": true,
-    "baseUrl": ".",
    "paths": {
      "@/*": ["./src/*"]
    },
--- a/002609.png
+++ b/002609.png
Author	SHA1	Message	Date
KiriAky 107	8f6d8a43d3	feat(layout): 更新应用名称为表易智融 - 将MainLayout组件中的应用名称从"智联文档"更新为"表易智融" - 更新侧边栏标题显示新的应用名称 - 统一所有相关界面的文字标识 fix(assistant): 同步更新AI助手介绍文本 - 更新Assistant页面中AI助手的自我介绍内容 - 将欢迎消息中的应用名称替换为"表易智融" docs(dashboard): 更新欢迎页面应用名称 - 修改Dashboard页面欢迎消息中的应用名称展示 - 确保用户界面的一致性体验 refactor(instruction-chat): 更新指令聊天页面助手名称 - 同步更新InstructionChat页面中AI助手的介绍文本 - 保持整个应用中品牌名称的统一性	2026-05-05 15:02:45 +08:00
KiriAky 107	6ec45b73ad	更新LLM配置并改进文件路径管理 - 将LLM服务从智谱AI切换到DeepSeek - 更新API密钥、基础URL和模型名称配置 - 改进文件路径配置说明，添加本地开发和Docker部署的路径差异说明 - 修复日志目录路径使用settings.BASE_DIR确保跨平台一致性	2026-04-21 21:20:14 +08:00
KiriAky 107	73f1c2804f	更新项目标题为智联文档 - 将项目标题从 "FilesReadSystem" 更改为 "智联文档" - 保持了原有的项目介绍部分结构	2026-04-21 20:48:18 +08:00
KiriAky 107	74d40f91c5	添加项目架构图和程序流程图 - 添加了使用Mermaid语法的项目架构图，展示前端、后端和数据层的组件关系 - 添加了程序流程图，详细描述文档上传、解析、存储、向量化和异步处理的完整流程 - 使用中文和英文对照的方式呈现图表内容，便于理解系统整体设计	2026-04-21 20:47:28 +08:00
KiriAky 107	d2e3c2db3e	添加 Docker 部署支持和环境变量配置添加了完整的 Docker 部署方案，包括： - 创建 .env.example 环境变量配置模板文件 - 新增 docker-compose.yml 用于全栈服务编排 - 为前后端分别创建 Dockerfile 实现容器化部署 - 添加 nginx.conf 配置前端反向代理 - 在 README.md 中详细说明 Docker 部署流程 - 集成 Celery 任务队列支持异步处理 - 配置多数据库服务 (MongoDB, MySQL, Redis) 的连接 - 实现健康检查和服务依赖管理	2026-04-21 20:39:12 +08:00
dj	be302839ee	feat: 添加文档转PDF转换功能 - 后端添加 PDF 转换服务，支持 Word(docx)、Excel(xlsx)、文本(txt)、Markdown(md) 格式转换为 PDF - 使用 reportlab 库，支持中文字体（simhei.ttf） - 添加 FastAPI 接口：POST /api/v1/pdf/convert 单文件转换，POST /api/v1/pdf/convert/batch 批量转换 - 前端添加 PdfConverter 页面，支持拖拽上传、转换进度显示、批量下载 - 转换流程：所有格式先转为 Markdown，再通过 Markdown 转 PDF，保证输出一致性 - DOCX 解析使用 zipfile 直接读取 XML，避免 python-docx 的兼容性问题的	2026-04-20 00:00:30 +08:00
dj	581e2b0ae0	添加系统架构图	2026-04-16 23:11:44 +08:00
dj	975ebf536b	添加系统架构图	2026-04-16 23:08:21 +08:00
dj	38b0c7e62e	Merge branch 'main' of https://gitea.kronecker.cc/OurCodesAreAllRight/FilesReadSystem	2026-04-16 20:00:51 +08:00
dj	8e46e635f1	rag日志改为info级	2026-04-16 19:59:56 +08:00