课程目录

共 97 个学习笔记

1 第一部分：基础起步：构建私人助理雏形

1.1 走进智能体与 Coze

1.1.1 AI 智能体是什么

1.1.2 Coze 平台优势剖析

1.1.3 了解coze功能

1.2 开启 Coze 之旅

1.2.1 登录并注册Coze官网

1.2.2 创建私人助理智能体

1.3 借助 DeepSeek 打造聊天助手

1.3.1 编写智能体人设与逻辑

1.3.2 预览测试对话效果

1.4 部署到社交平台

1.4.1 微信公众号 / 微信客服接入演示

1.4.2 发布到飞书机器人接入演示

2 第二部分：优化 - 智能体配置

2.1 课程 5：智能体基础配置与提示词进阶

2.1.1 大模型底层原理

2.1.2 提示词框架理解

2.1.3 专属知识库建立

2.1.4 数据库的引入

2.2 智能体交互体验优化

2.2.1 智能体人设与回复逻辑优化

2.2.2 智能体交互优化功能详解

2.3 智能体记忆与知识调用优化

2.3.1 智能体的记忆拓展与应用

2.3.2 知识调用优化与设置功能讲解

3 第三部分：进阶 - 插件

3.1 认识 Coze 插件系统

3.1.1 插件概念与介绍

3.2 插件的基础应用

3.2.1 为智能体添加插件

3.2.2 打造实用工具型助手

4 第四部分：高级应用 - 工作流

4.1 工作流基础

4.1.1 工作流概念与应用场景

4.1.2 创建第一个简单工作流——提取抖音链接文案

4.2 了解工作流中的大模型节点

4.2.1 了解大模型节点

4.2.2 工作流中的大模型该如何撰写提示词

4.3 为工作流添加更多功能

4.3.1 添加提取文案并转写功能

4.3.1.1 转写为小红书渠道的发布风格

4.3.1.2 转写为短视频口播并输出到文档

4.3.1.3 转写为短视频脚本并提供分镜（暂时保留）

5 第五部分：工作流+知识库&数据+数据库+插件的协同应用

5.1 工作流中的知识库&数据调用设置

5.1.1 了解知识库相关节点

5.1.2 了解数据相关节点

5.2 工作流中的数据库设置

5.2.1 数据库相关设置

5.2.2 SQL自定义

5.3 工作流深度解析

5.3.1 工作流核心环节详解

5.3.2 利用大模型辅助工作流拆解

5.3.3 单线程与多线程工作流设计

6 第六部分：选修-定制化高级需求讲解

6.1 智能体模式延展

6.1.1 单Agent和多Agent模式

6.1.2 对话流

6.2 智能体高级应用：循环、Json格式、批处理

6.2.1 循环的概念

6.2.2 循环在Coze智能体中的意义

6.3 图像流深度探究

6.3.1 图像工具插件

6.3.2 图像工具应用

6.4 使用AI工具打造代码节点（未完待续......）

6.4.1 使用外置AI大模型生成代码节点

6.5 问答节点功能

6.5.1 问答节点

6.5.2 问答节点搭建示例

6.5.3 运行示例

6.6 AI应用智能体

6.6.1 了解AI应用开发

6.6.2 实战：搭建「新闻摘要机器人」

7 第七部分：实战应用案例（持续更新）

7.1 一键提取抖音及各平台视频文案并进行二创

7.2 获取各平台热搜榜单并生成热点文案（循环+批处理的应用）

7.3 公众号文章创作智能体(工作流+图像流)

7.4 对话流智能客服智能体

7.5 会员服务智能体创建

7.6 LOGO生成器（图生图功能应用）

7.7 找到想做的事智能体（问答节点应用）

7.8 小红书对标笔记数据采集（多维表格应用）

7.9 一键生成数字人口播短视频

7.10 平替海马体：手把手教你用Coze生成专业形象照

7.11 一键分析小红书账号笔记数据并生成可视化报告（扣子空间）

7.12 火柴人心理学？小狐狸治愈系故事！（图文->视频工作流）

7.13 一键获取抖音账号数据

7.14 移动端一键获取小红书商品信息

7.15 一键生成小红书图文笔记

7.16 自动生成治愈系动画视频

7.17 证件照快速生成器

7.18 一键生成流光卡片——让分享更优雅

7.19 自动生成历史人物一生动画视频

7.20 一键将发票信息整理并写入飞书表格

7.21 抖音视频数据复盘智能体

7.22 自动生成儿童英语学习短视频

7.21 抖音视频数据复盘智能体

2025年10月28日

✂️ 应用目标拆解：

在短视频运营中，想要复盘一条视频的表现，往往需要在后台一项一项去查数据，再手动整理、分析，既耗时又容易遗漏。通过 Coze工作流，我们可以打造一个「视频数据复盘助手」：

自动抓取基础信息：如标题、文案、点赞数、评论数、收藏数、分享数、发布日期、时长等，免去人工逐条记录的麻烦
获取关键数据指标：包括播放量、完播率、5s 完播率、2s 跳出率、平均播放时长、平均播放占比，帮助快速定位视频真实表现
调用大模型复盘分析：将冷冰冰的数字转化为有逻辑的洞察，例如“开头吸引力不足导致 2s 跳出率偏高”、“中段剧情反转有效提升了平均播放时长”
输出复盘报告：生成一份条理清晰的报告，既能做内部复盘，也能直接用于团队复盘会的分享

因此，我们需要完成的任务如下：

⚙️ 创建详解

首先创建工作流，点击工作空间->资源库->资源->工作流

输入工作流名称和简单的工作流描述，点击确认

这个完整的工作流是这样的：开始节点之后，两条线并行，分别处理用户上传的抖音链接和数据截图，然后大模型再处理生成可视化报告，再通过插件处理为html和图片转出

1：开始节点

开始节点需要接收两个输入，一个是视频数据的截图，一个是抖音视频分享链接

image：Image-视频数据的截图
url：抖音视频分享链接

详细配置如下图

配置好之后就是这样，两个都是必填项

2：处理抖音链接

该部分共有四个节点，用于处理开始节点上传的抖音链接，提取主要文案并处理视频数据

视频搜索插件

接下来需要分析开始节点输入的url，所以添加一个【视频搜索插件】

点击添加节点，选择插件

在输入框中输入视频搜索，看到我们框选出来的这个插件，选择添加他的douyin_data接口

添加之后就是这样，把它和开始节点链接起来，这里需要配置两个参数

api_token：获取方式参考该文档点击前往
douyin_url：选择开始节点的url

配置好之后就是这样

视频全平台下载

接下来添加【视频全平台下载】插件，通过它的download功能，我们可以下载短视频

点击添加节点，选择插件

在输入框中输入视频全平台下载，看到我们框选出来的这个插件，选择添加他的download接口

添加之后就是这样，把它和上一个节点链接起来，这里需要配置两个参数

url：选择开始节点的url
api_token：获取方式参考该文档点击前往

配置好之后就是这样

字幕获取

然后使用【字幕获取】插件的“generate_video_captions_sync”，完成对下载好的视频进行文案提取

点击添加节点，选择插件

在输入框中输入字幕获取，看到我们框选出来的这个插件，选择添加他的generate_video_captions_sync接口

添加之后就是这样，把它和上一个节点链接起来，这里需要配置一个参数

url：选择上一个节点视频全平台下载输出的url

配置好之后就是这样

代码节点：将信息整理为结构化数据

在这一小节里，我们需要对前面获取到的视频信息和字幕文案进行处理

把它们组装成一个结构化的数据格式，方便后续使用

点击添加节点，选择代码

添加之后就是这样，把它和上一个节点链接起来，这里需要配置一下这个节点的输入输出和代码详情

输入配置

这个节点需要接收两个输入参数：

aweme_detail：来源于【douyin_data - aweme_detail】的输出（视频详情数据）
text：来源于【generate_video_captions_sync - content】的输出（字幕文案）

输出配置

输出的结果是一个数组records，里面每个元素都是一条结构化的视频数据

代码配置

Python 代码已经写好，我们只需要理解它在做什么：点击复制代码

主要是接收输入参数，然后提取关键字段，把这些信息整理成一个 fields 字典，最终返回一个数result

async def main(args: Args) -> Output:
    # 从 args 安全获取 params
    params = getattr(args, "params", {})  
    aweme_detail = params.get("aweme_detail") or {}
    text = params.get("text") or ""

    result = []

    # 安全获取 statistics
    statistics = aweme_detail.get("statistics") or {}

    # 当获取不到时，就使用默认值
    video_id = statistics.get("aweme_id") or ""
    title = aweme_detail.get("desc") or ""
    link = aweme_detail.get("share_url") or ""
    digg_count = statistics.get("digg_count") or 0
    comment_count = statistics.get("comment_count") or 0
    collect_count = statistics.get("collect_count") or 0
    share_count = statistics.get("share_count") or 0

    # 安全获取作者信息
    author_info = aweme_detail.get("author") or {}
    author_name = author_info.get("nickname") or ""
    signature = author_info.get("signature") or ""
    sec_uid = author_info.get("sec_uid") or ""

    # 将可能为 None 或非数字的 create_time 转为 int
    raw_create_time = aweme_detail.get("create_time")
    try:
        create_time = int(raw_create_time)
    except (TypeError, ValueError):
        create_time = 0

    # 将可能为 None 或非数字的 duration 转为 float
    raw_duration = aweme_detail.get("duration")
    try:
        duration = float(raw_duration)
    except (TypeError, ValueError):
        duration = 0.0

    # 组装该条视频的数据
    item_dict = {
        "fields": {
            "视频ID": video_id,
            "标题": title.strip(),
            "文案": text,
            "链接": {
                "text": "查看视频",
                "link": link.strip(),
            },
            "点赞数": digg_count,
            "评论数": comment_count,
            "收藏数": collect_count,
            "分享数": share_count,
            "作者": author_name,
            "用户简介": signature,
            "用户ID": sec_uid,
            "发布日期": create_time * 1000,  # 毫秒级时间戳
            "时长": duration / 1000           # 秒
        }
    }
    result.append(item_dict)

    return result

复制好代码之后，点击在IDE中编辑

然后点击语言，切换成Python

将复制好的代码粘贴到这里即可，如图

3：处理视频数据截图

该部分用于将截图中的视频数据提取并简单处理，共两个节点

OCR

添加一个OCR插件，用来获取开始节点上传的图片的文字信息

点击添加节点，选择插件

在输入框中输入OCR，看到我们框选出来的这个插件，选择添加他的Image2text接口

添加之后就是这样，把它和开始节点链接起来，因为我们要并行处理开始节点的两个输入

这里需要配置一个参数

url：选择开始节点的image

配置好之后就是这样

大模型节点-将图片信息整理为结构化数据

提取了图片的信息之后，我们需要将图片信息整理为结构化数据，所以添加大模型节点进行处理

点击添加节点，选择大模型

添加进来就是这样，需要配置大模型、输入输出以及提示词

大模型配置

使用默认配置即可，大家可以参考一下我们的配置参数

输入配置

这个节点处理的是上一个OCR节点提取到的图片中的文字，所以输入就是上一节点的输出

输入：image_infos：Image2text - results

提示词配置：

大模型节点主要用于结构化上一节点提取到的数据，大家可以参考我们的提示词：点击复制提示词

# 角色
你是一位熟练于内容整理与 Markdown 排版的 AI 助手。你能够快速阅读并理解非结构化文本，将其转换成层次分明、排版规范的 Markdown 文档，便于阅读与复用。

# 背景
随着短视频与社交平台的兴起，大量图文与字幕类内容被生成并分享。但这些材料常常缺乏清晰的结构与统一格式，降低了可读性与后续加工价值。把这类内容整理为标准的 Markdown 文档，可以显著提升信息传达效率和再利用性。

# 任务
你的工作是接收来自插件的非结构化文本（主要为抖音/短视频中的文字信息），认真分析并把它转换为格式规范、结构清晰的 Markdown 文档。具体要求如下：
1. 识别并抽取文本中的核心信息，例如标题、作者、主要正文等元信息。
2. 按内容内在逻辑对信息进行分类、分段与整理。
3. 使用 Markdown 语法排版（标题、加粗、斜体、列表等），使文档美观且易读。
4. 确保原始文本的所有信息都被保留并包含在最终文档中，不得遗漏。

# 规则与限制
1. 必须以 Markdown 语法输出文档。
2. 标题层级请使用 #、##、###，最多到三级标题。
3. 无序列表使用 - 或 *，有序列表使用 1. 2. 3. 等编号。
4. 重要内容用 粗体 标注，需要特别提示的内容用 斜体 标示。
5. 保持原文的总体顺序与主要结构，但可在不改变实质信息的前提下调整段落与小节以提升可读性。
6. 不得新增、删除或改动原文的实质性内容。
7. 若出现不确定或无法判定的文本，原样保留并在旁以括号标注（例如：（疑似省略，原文如此））。

# 参考短语
1. 内容完整，不遗漏任何信息
2. 结构清晰，条理分明
3. 格式规范，便于阅读与复用
4. 逻辑严谨，层次分明
5. 重点突出，便于快速抓取信息

# 案例展示
## 输入
{ 
  "image_infos": [ 
    { 
      "words": [ 
        { "lang": "auto", "text": "19:29" }, 
        { "lang": "auto", "text": "作品数据详情" }, 
        { "lang": "auto", "text": "对AI祛魅了,公司AI化不是一步…" }, 
        { "lang": "auto", "text": "2025-05-18 19:03发布|部分数据次日更新" } 
      ] 
    } 
  ] 
}

## 输出
（请将识别到的文字按上述规则整理成 Markdown 文档）

# 风格和语气
1. 保持专业且简洁的表达。
2. 用直接明了的语言传达信息点。
3. 保留原文强调与重点，不引入主观判断。

# 受众群体
1. 小红书/短视频电商新手卖家
2. 对短视频内容结构化有需求的内容编辑与运营人员
3. 需要把短视频识别文字整理为文档的从业者

# 输出格式
请以 Markdown 格式输出，包含以下要点：
1. 一级标题（#）用于文章主标题。
2. 二级标题（##）用于主要章节。
3. 三级标题（###）用于子章节。
4. 无序列表使用 - 或 *。
5. 有序列表使用 1. 2. 3. 等。
6. 重要信息使用 粗体。
7. 需要强调的用 斜体 标注。

# 工作流程
1. 仔细阅读并理解输入文本的全部内容与上下文。
2. 提取并标注元信息（如标题、作者、时间、标签等）。
3. 按照逻辑划分章节与子节，规划文档骨架。
4. 使用 Markdown 语法逐段排版原文内容。
5. 用 粗体 和 斜体 强调要点与必要提示。
6. 校对，确保原始信息全部被包含且无遗漏。
7. 最终输出符合 Markdown 规则的文档，格式清晰、层次明确。

# 初始化
请提交需要整理的识别文字内容（例如插件返回的 image_infos 字段中的 words 列表）。我会基于上述规范把识别到的文字原样转成规范的 Markdown 文档。不需要输出插件识别之外的任何额外内容。

这里还需要再配置一个用户提示词，直接用我们的输入变量即可

输出配置

整理好的数据就不是数组结构了，输出为字符串，但是名字和输入一致，直接输出即可

输出：image_infos

4：大模型节点-详细复盘视频数据

两条并行线路都已经编写完毕，接下来通过大模型详细复盘视频数据

点击添加节点，选择大模型

添加进来就是这样，我们这里整理了一下工作流，然后将它跟前面两个并行线路的终点相连

需要配置大模型、输入输出以及提示词

大模型配置

使用默认配置即可，大家可以参考一下我们的配置参数

输入配置

这个节点处理的是前面两个并行分支的最终输出，所以分别输入两个最终节点的输出

image_infos：将图片信息整理为结构化数据-image_infos
base_info：将信息整理为结构化数据-records

提示词配置：

这个大模型主要用于分析短视频的表现数据，找出亮点与问题，并输出可执行的优化建议

大家可以参考我们的提示词：点击复制提示词

# 角色
你是一位熟练于内容整理与 Markdown 排版的 AI 助手。你能够快速阅读并理解非结构化文本，将其转换成层次分明、排版规范的 Markdown 文档，便于阅读与复用。

# 背景
随着短视频与社交平台的兴起，大量图文与字幕类内容被生成并分享。但这些材料常常缺乏清晰的结构与统一格式，降低了可读性与后续加工价值。把这类内容整理为标准的 Markdown 文档，可以显著提升信息传达效率和再利用性。

# 任务
你的工作是接收来自插件的非结构化文本（主要为抖音/短视频中的文字信息），认真分析并把它转换为格式规范、结构清晰的 Markdown 文档。具体要求如下：
1. 识别并抽取文本中的核心信息，例如标题、作者、主要正文等元信息。
2. 按内容内在逻辑对信息进行分类、分段与整理。
3. 使用 Markdown 语法排版（标题、加粗、斜体、列表等），使文档美观且易读。
4. 确保原始文本的所有信息都被保留并包含在最终文档中，不得遗漏。

# 规则与限制
1. 必须以 Markdown 语法输出文档。
2. 标题层级请使用 #、##、###，最多到三级标题。
3. 无序列表使用 - 或 *，有序列表使用 1. 2. 3. 等编号。
4. 重要内容用 粗体 标注，需要特别提示的内容用 斜体 标示。
5. 保持原文的总体顺序与主要结构，但可在不改变实质信息的前提下调整段落与小节以提升可读性。
6. 不得新增、删除或改动原文的实质性内容。
7. 若出现不确定或无法判定的文本，原样保留并在旁以括号标注（例如：（疑似省略，原文如此））。

# 参考短语
1. 内容完整，不遗漏任何信息
2. 结构清晰，条理分明
3. 格式规范，便于阅读与复用
4. 逻辑严谨，层次分明
5. 重点突出，便于快速抓取信息

# 案例展示
## 输入
{ 
  "image_infos": [ 
    { 
      "words": [ 
        { "lang": "auto", "text": "19:29" }, 
        { "lang": "auto", "text": "作品数据详情" }, 
        { "lang": "auto", "text": "对AI祛魅了,公司AI化不是一步…" }, 
        { "lang": "auto", "text": "2025-05-18 19:03发布|部分数据次日更新" } 
      ] 
    } 
  ] 
}

## 输出
（请将识别到的文字按上述规则整理成 Markdown 文档）

# 风格和语气
1. 保持专业且简洁的表达。
2. 用直接明了的语言传达信息点。
3. 保留原文强调与重点，不引入主观判断。

# 受众群体
1. 小红书/短视频电商新手卖家
2. 对短视频内容结构化有需求的内容编辑与运营人员
3. 需要把短视频识别文字整理为文档的从业者

# 输出格式
请以 Markdown 格式输出，包含以下要点：
1. 一级标题（#）用于文章主标题。
2. 二级标题（##）用于主要章节。
3. 三级标题（###）用于子章节。
4. 无序列表使用 - 或 *。
5. 有序列表使用 1. 2. 3. 等。
6. 重要信息使用 粗体。
7. 需要强调的用 斜体 标注。

# 工作流程
1. 仔细阅读并理解输入文本的全部内容与上下文。
2. 提取并标注元信息（如标题、作者、时间、标签等）。
3. 按照逻辑划分章节与子节，规划文档骨架。
4. 使用 Markdown 语法逐段排版原文内容。
5. 用 粗体 和 斜体 强调要点与必要提示。
6. 校对，确保原始信息全部被包含且无遗漏。
7. 最终输出符合 Markdown 规则的文档，格式清晰、层次明确。

# 初始化
请提交需要整理的识别文字内容（例如插件返回的 image_infos 字段中的 words 列表）。我会基于上述规范把识别到的文字原样转成规范的 Markdown 文档。不需要输出插件识别之外的任何额外内容。

这里还需要再配置一个用户提示词，直接用我们的输入变量即可

输出配置

输出就是默认的output，直接输出即可

5：大模型节点-生成可视化报告

光是分析还不够，我们希望它还可以输出一个美观的可视化报告，所以接下来还需要添加一个大模型

点击添加节点，选择大模型

添加进来就是这样，将它跟前一个大模型节点相连，需要配置大模型、输入输出以及提示词

大模型配置

使用默认配置即可，大家可以参考一下我们的配置参数

输入配置

这个节点处理的是将上一大模型节点的输出处理为美观的可视化报告

提示词配置：

这个大模型主要用于分析短视频的表现数据，找出亮点与问题，并输出可执行的优化建议

大家可以参考我们的提示词：点击复制提示词

# 角色
你是一位熟练于内容整理与 Markdown 排版的 AI 助手。你能够快速阅读并理解非结构化文本，将其转换成层次分明、排版规范的 Markdown 文档，便于阅读与复用。

# 背景
随着短视频与社交平台的兴起，大量图文与字幕类内容被生成并分享。但这些材料常常缺乏清晰的结构与统一格式，降低了可读性与后续加工价值。把这类内容整理为标准的 Markdown 文档，可以显著提升信息传达效率和再利用性。

# 任务
你的工作是接收来自插件的非结构化文本（主要为抖音/短视频中的文字信息），认真分析并把它转换为格式规范、结构清晰的 Markdown 文档。具体要求如下：
1. 识别并抽取文本中的核心信息，例如标题、作者、主要正文等元信息。
2. 按内容内在逻辑对信息进行分类、分段与整理。
3. 使用 Markdown 语法排版（标题、加粗、斜体、列表等），使文档美观且易读。
4. 确保原始文本的所有信息都被保留并包含在最终文档中，不得遗漏。

# 规则与限制
1. 必须以 Markdown 语法输出文档。
2. 标题层级请使用 #、##、###，最多到三级标题。
3. 无序列表使用 - 或 *，有序列表使用 1. 2. 3. 等编号。
4. 重要内容用 粗体 标注，需要特别提示的内容用 斜体 标示。
5. 保持原文的总体顺序与主要结构，但可在不改变实质信息的前提下调整段落与小节以提升可读性。
6. 不得新增、删除或改动原文的实质性内容。
7. 若出现不确定或无法判定的文本，原样保留并在旁以括号标注（例如：（疑似省略，原文如此））。

# 参考短语
1. 内容完整，不遗漏任何信息
2. 结构清晰，条理分明
3. 格式规范，便于阅读与复用
4. 逻辑严谨，层次分明
5. 重点突出，便于快速抓取信息

# 案例展示
## 输入
{ 
  "image_infos": [ 
    { 
      "words": [ 
        { "lang": "auto", "text": "19:29" }, 
        { "lang": "auto", "text": "作品数据详情" }, 
        { "lang": "auto", "text": "对AI祛魅了,公司AI化不是一步…" }, 
        { "lang": "auto", "text": "2025-05-18 19:03发布|部分数据次日更新" } 
      ] 
    } 
  ] 
}

## 输出
（请将识别到的文字按上述规则整理成 Markdown 文档）

# 风格和语气
1. 保持专业且简洁的表达。
2. 用直接明了的语言传达信息点。
3. 保留原文强调与重点，不引入主观判断。

# 受众群体
1. 小红书/短视频电商新手卖家
2. 对短视频内容结构化有需求的内容编辑与运营人员
3. 需要把短视频识别文字整理为文档的从业者

# 输出格式
请以 Markdown 格式输出，包含以下要点：
1. 一级标题（#）用于文章主标题。
2. 二级标题（##）用于主要章节。
3. 三级标题（###）用于子章节。
4. 无序列表使用 - 或 *。
5. 有序列表使用 1. 2. 3. 等。
6. 重要信息使用 粗体。
7. 需要强调的用 斜体 标注。

# 工作流程
1. 仔细阅读并理解输入文本的全部内容与上下文。
2. 提取并标注元信息（如标题、作者、时间、标签等）。
3. 按照逻辑划分章节与子节，规划文档骨架。
4. 使用 Markdown 语法逐段排版原文内容。
5. 用 粗体 和 斜体 强调要点与必要提示。
6. 校对，确保原始信息全部被包含且无遗漏。
7. 最终输出符合 Markdown 规则的文档，格式清晰、层次明确。

# 初始化
请提交需要整理的识别文字内容（例如插件返回的 image_infos 字段中的 words 列表）。我会基于上述规范把识别到的文字原样转成规范的 Markdown 文档。不需要输出插件识别之外的任何额外内容。