008-文档

1. 介绍

应用场景:

采集主流视频网站Youtube视频信息,包含

视频描述,频道名称,视频时长,观看次数,评论次数,喜欢次数,视频封面

创建时间,更新时间,发布日期,获取字幕等。

获取到的数据可以给AI大模型进行处理。

  1. 抓取数据:
    1. 付费视频抓取网站Apify抓取指定的视频平台
  1. 处理数据:
    1. 抓取数据有Apify平台直接处理
    2. 抓取的数据可以让AI大模型处理
  1. 存放数据:
    1. 获取的所有数据直接存放在Notion上

2. 操作步骤

2.1. Notion配置

2.2. 指定需要抓取的网站或者频道链接

2.3. 迭代器模块

2.4. 配置Make和Apify连接

2.5. Apify网站配置视频抓取规则

2.6. 配置Apify模块

{
  "dateFilter": "year",
  "downloadSubtitles": true,
  "hasCC": false,
  "hasLocation": false,
  "hasSubtitles": false,
  "is360": false,
  "is3D": false,
  "is4K": false,
  "isBought": false,
  "isHD": false,
  "isHDR": false,
  "isLive": false,
  "isVR180": false,
  "maxResultStreams": 0,
  "maxResults": 10,
  "maxResultsShorts": 0,
  "preferAutoGeneratedSubtitles": false,
  "saveSubsToKVS": false,
  "searchQueries": [
    "Crawlee"
  ],
  "sortingOrder": "date",
  "startUrls": [
    {
      "url": "{{2.value}}",
      "method": "GET"
    }
  ],
  "videoType": "video"
}

2.7. 获取Apify抓取的内容

2.8. 数据存放-Notion模块

2.9. 存放字幕-Notion模块