008-文档
1. 介绍
应用场景:
采集主流视频网站Youtube视频信息,包含
视频描述,频道名称,视频时长,观看次数,评论次数,喜欢次数,视频封面
创建时间,更新时间,发布日期,获取字幕等。
获取到的数据可以给AI大模型进行处理。
- 抓取数据:
-
- 付费视频抓取网站Apify抓取指定的视频平台
- 处理数据:
-
- 抓取数据有Apify平台直接处理
- 抓取的数据可以让AI大模型处理
- 存放数据:
-
- 获取的所有数据直接存放在Notion上
![]()
2. 操作步骤
2.1. Notion配置
![]()
2.2. 指定需要抓取的网站或者频道链接
![]()
2.3. 迭代器模块
![]()
2.4. 配置Make和Apify连接
![]()
![]()
2.5. Apify网站配置视频抓取规则
![]()
![]()
![]()
![]()
![]()
![]()
![]()
2.6. 配置Apify模块
![]()
{
"dateFilter": "year",
"downloadSubtitles": true,
"hasCC": false,
"hasLocation": false,
"hasSubtitles": false,
"is360": false,
"is3D": false,
"is4K": false,
"isBought": false,
"isHD": false,
"isHDR": false,
"isLive": false,
"isVR180": false,
"maxResultStreams": 0,
"maxResults": 10,
"maxResultsShorts": 0,
"preferAutoGeneratedSubtitles": false,
"saveSubsToKVS": false,
"searchQueries": [
"Crawlee"
],
"sortingOrder": "date",
"startUrls": [
{
"url": "{{2.value}}",
"method": "GET"
}
],
"videoType": "video"
}
2.7. 获取Apify抓取的内容
![]()
2.8. 数据存放-Notion模块
![]()
![]()
2.9. 存放字幕-Notion模块
![]()