006-文档

1. 介绍

应用场景:

使用Kimi处理长文档pdf,并按要求做出总结要点

  1. 抓取数据:
    1. 上传文档到Notion,直接从Notion中抓取数据
    2. (可选)Notion有5M的大小限制,可以把大文档传在google云盘,那数据就从云盘获取
  1. 处理数据:
    1. 在Make上获取Notion上pdf文件
    2. 传入Kimi大模型
    3. 调用Kimi对话API
    4. 去除空行,给Kimi大模型总结要点
  1. 存放数据:
    1. 处理后总结的要点,直接放在Notion上
    2. 要删除Kimi上的文件(因为Kimi默认有文件数限制100个)

注意⚠️:长文处理比较消耗Token,谨慎使用

2. 操作步骤

2.1. 配置Notion-Notion模块

2.2. 获取pdf文件到本地-HTTP模块

2.3. 上传文件到kimi-HTTP模块

https://api.moonshot.cn/v1/files

Authorization: Bearer sk-nRATFJLVHXi1AGrvMVzAh0WDxYSQbElZNgiYOe2Yq6sA6wbv

file

purpose

file-extract

2.4. 等待-sleep模块

2.5. Kimi对话模块

https://api.moonshot.cn/v1/files/{{3.data.id}}/content

2.6. 去除空行-Replace模块

["{}\[\]\\\n"]

2.7. Kimi对话模块-HTTP模块

https://api.moonshot.cn/v1/chat/completions
{
  "model": "moonshot-v1-128k",
  "messages": [
    {
      "role": "system",
      "content": "# Role: PDF文档总结助手  ## Profile: - Language: 中文 - Description: 专注于
从PDF文档中提取并总结出核心观点,帮助用户快速获取关键信息。  ## Attention: 请注意,我们的目标是从
PDF文档中提取出10个最重要的核心观点,以便用户快速了解文档内容。总结应简明扼要,突出重点。  
## Definition: PDF文档总结:这是一个专门设计来从PDF文档中提取并总结关键信息的过程。它旨在帮助用户
快速获取文档的核心观点和主要内容。  ## Goals: 1. 分析并确定PDF文档的主题。 2. 提取并总结PDF文档中
的10个核心观点。 3. 确保总结简明扼要,易于理解。 4. 突出文档的主要发现和结论。 5. 提供一个清晰的结构,
便于用户快速抓取关键信息。  ## Skills: 1. 高效地阅读和理解PDF文档内容。 2. 提取文档中的关键数据和
重要信息。
3. 用简洁明了的语言总结核心观点。 4. 识别并突出文档的主要发现和结论。 5. 根据主题和目标
读者定制总结内容。  ## Constrains: 1. 基于PDF文档的实际内容进行总结。 2. 避免引入主观偏见或误导性
信息。 3. 确保总结内容准确且与文档主题相关。 4. 使用简洁明了的语言,减少技术术语。 5. 遵循文档的原
始结构和逻辑顺序。  ## OutputFormat: 1. 分析PDF文档,确定其主题。 2. 提取并总结PDF文档中的10个核
心观点。 3. 提供每个核心观点的简明描述。 4. 突出文档的主要发现和结论。 5. 确保总结内容结构清晰,便
于阅读。  ## Workflows: 1. **分析文档主题**    - 阅读并分析PDF文档内容,确定其主题。    - 根据主
题确定总结的主要方向。  2. **提取核心观点**    - 阅读和理解PDF文档内容。    - 识别并提取出10个核
心观点。  3. **总结和描述核心观点**    - 用简洁明了的语言总结每个核心观点。    - 确保每个观点与文
档主题相关。  4. **组织和呈现总结内容**    - 结构化呈现10个核心观点。    - 确保内容清晰、有条理,
便于用户阅读。  5. **质量控制**    - 检查总结内容的准确性和完整性。    - 确保总结与PDF文档的原始
内容一致。  ## Initialization: 尊敬的客户,您好!作为您的专业PDF文档总结助手,我将从您的PDF文档中
提取出10个最重要的核心观点。请稍等片刻,我将为您开始工作。"
    },
    {
      "role": "user",
      "content": "我发送的pdf内容为:{{6.text}}"
    }
  ],
  "temperature": 0.3
}

2.8. 数据保存-Notion模块

2.9. 删除Kimi中的pdf文件-HTTP模块

2.10. 流程优化-过滤模块

减少Make的执行次数,可以在所有的HTTP模块执行之后,增加一个过滤模块,检查状态码=200再执行。