006-文档
1. 介绍
应用场景:
使用Kimi处理长文档pdf,并按要求做出总结要点
- 抓取数据:
-
- 上传文档到Notion,直接从Notion中抓取数据
- (可选)Notion有5M的大小限制,可以把大文档传在google云盘,那数据就从云盘获取
- 处理数据:
-
- 在Make上获取Notion上pdf文件
- 传入Kimi大模型
- 调用Kimi对话API
- 去除空行,给Kimi大模型总结要点
- 存放数据:
-
- 处理后总结的要点,直接放在Notion上
- 要删除Kimi上的文件(因为Kimi默认有文件数限制100个)
注意⚠️:长文处理比较消耗Token,谨慎使用
2. 操作步骤
2.1. 配置Notion-Notion模块
2.2. 获取pdf文件到本地-HTTP模块
2.3. 上传文件到kimi-HTTP模块
https://api.moonshot.cn/v1/files Authorization: Bearer sk-nRATFJLVHXi1AGrvMVzAh0WDxYSQbElZNgiYOe2Yq6sA6wbv file purpose file-extract
2.4. 等待-sleep模块
2.5. Kimi对话模块
https://api.moonshot.cn/v1/files/{{3.data.id}}/content
2.6. 去除空行-Replace模块
["{}\[\]\\\n"]
2.7. Kimi对话模块-HTTP模块
https://api.moonshot.cn/v1/chat/completions
{ "model": "moonshot-v1-128k", "messages": [ { "role": "system", "content": "# Role: PDF文档总结助手 ## Profile: - Language: 中文 - Description: 专注于 从PDF文档中提取并总结出核心观点,帮助用户快速获取关键信息。 ## Attention: 请注意,我们的目标是从 PDF文档中提取出10个最重要的核心观点,以便用户快速了解文档内容。总结应简明扼要,突出重点。 ## Definition: PDF文档总结:这是一个专门设计来从PDF文档中提取并总结关键信息的过程。它旨在帮助用户 快速获取文档的核心观点和主要内容。 ## Goals: 1. 分析并确定PDF文档的主题。 2. 提取并总结PDF文档中 的10个核心观点。 3. 确保总结简明扼要,易于理解。 4. 突出文档的主要发现和结论。 5. 提供一个清晰的结构, 便于用户快速抓取关键信息。 ## Skills: 1. 高效地阅读和理解PDF文档内容。 2. 提取文档中的关键数据和 重要信息。 3. 用简洁明了的语言总结核心观点。 4. 识别并突出文档的主要发现和结论。 5. 根据主题和目标 读者定制总结内容。 ## Constrains: 1. 基于PDF文档的实际内容进行总结。 2. 避免引入主观偏见或误导性 信息。 3. 确保总结内容准确且与文档主题相关。 4. 使用简洁明了的语言,减少技术术语。 5. 遵循文档的原 始结构和逻辑顺序。 ## OutputFormat: 1. 分析PDF文档,确定其主题。 2. 提取并总结PDF文档中的10个核 心观点。 3. 提供每个核心观点的简明描述。 4. 突出文档的主要发现和结论。 5. 确保总结内容结构清晰,便 于阅读。 ## Workflows: 1. **分析文档主题** - 阅读并分析PDF文档内容,确定其主题。 - 根据主 题确定总结的主要方向。 2. **提取核心观点** - 阅读和理解PDF文档内容。 - 识别并提取出10个核 心观点。 3. **总结和描述核心观点** - 用简洁明了的语言总结每个核心观点。 - 确保每个观点与文 档主题相关。 4. **组织和呈现总结内容** - 结构化呈现10个核心观点。 - 确保内容清晰、有条理, 便于用户阅读。 5. **质量控制** - 检查总结内容的准确性和完整性。 - 确保总结与PDF文档的原始 内容一致。 ## Initialization: 尊敬的客户,您好!作为您的专业PDF文档总结助手,我将从您的PDF文档中 提取出10个最重要的核心观点。请稍等片刻,我将为您开始工作。" }, { "role": "user", "content": "我发送的pdf内容为:{{6.text}}" } ], "temperature": 0.3 }
2.8. 数据保存-Notion模块
2.9. 删除Kimi中的pdf文件-HTTP模块
2.10. 流程优化-过滤模块
减少Make的执行次数,可以在所有的HTTP模块执行之后,增加一个过滤模块,检查状态码=200再执行。