前言
本文主要讲述我搭建整个AI笔记整理助手的思路,并在文尾提供已完成的插件文件和通过修改coze密钥来使用自己的智能体的相关指引。
想法的起始
最近在学习一些新的知识,发现日常都是在工作中或者在家中,通过一些论坛或者网站阅读文章后,然后把觉得需要记录的句子或者段落记录下来。
但是我经常性地为了图省事,经常性地直接把文本直接复制到笔记软件里,想着后面回过头来会看一下。时间一长,就发现笔记本里已经堆满了不同的单句、段落,有时候甚至想不起当时为什么会记录这些内容。

不知道是否也有人和我遇见了一样的问题,我回顾一下了我的笔记摘录路径,试图找出是哪个环节造成了这样的情况。

- 文章阅读:浏览器阅读的文章带有不同的格式的文本,不同网站使用的文本格式更是不同,直接复制粘贴会把格式带上;
- 文本摘录:通常需要笔记本软件进行辅助,一般会根据当前的记录主题创建目录再进行摘录;如果需要记录来源网址,则需二次记录。
- 摘录文本整理:一般初步摘录的文本时比较凌乱的,需要时间整理,或者调整格式来达到自己想呈现的笔记效果。
- 回顾:一般在上班或者下班路上进行回顾,需要能用手机进行阅读;而且面对未整理的文档,阅读欲会大大降低。
归纳了几个我的核心需求点:
- 网页的阅读环境下能快速摘录文本;
- 自动按我的想法整理文本,能够帮我加强对某些内容和定义的记忆;
- 能通过手机进行回顾。
思考过后,想到之前做的一款插件(WordPilot英语学习插件搭建 - 少数派、)可以作为不错的思路延展,既然已经可以记单词,自然也可以做进一步的延展,也用来记录笔记。
基于前面的核心需求点,已经可以有整个大致思路:抓手获取、大脑思考、载体承载结果;我想要的是一个只需要“拾取”(pick it up)就能用起来的工具。

「抓手」:网页插件工具
照例还是使用VS code和augment进行插件开发。
绘制简单的原型图:

编写初步的的PRD文档,确定核心的必要功能,不需要一步到位完整列出所有功能,只需要讲述完整的项目形态,以及能想到的一些功能。

原型和初步的PRD不代表插件的最终形态,只为了给AI有一个整体上的概念,确保产品的关键主干在自己的把控之下,其他部分可以在后续与AI的交流中可以不断完善。
最后在沟通的过程中,完成具备记录功能的插件「Pickit」的初步产品形态,以下为一些核心的功能点:
- 抽屉式功能悬窗触发;
![触发弹窗.mp4 [video-to-gif output image]](https://cdnfile.sspai.com/2025/08/09/article/382f88b5606d2f66d1e2aa1cbeb5485e.gif)
- 部分无限制网站可通过快捷键Alt+p直接获取文本进行摘录,同时记录文本的来源;
![20250809_221116.mp4 [video-to-gif output image]](https://cdnfile.sspai.com/2025/08/09/article/9e6bde075878286c88867694ce7afb7e.gif)
- 部分限制网站无法使用快捷键(如微信读书、知乎等),可先复制,再粘贴到输入框中保存,也会同时记录下摘录文本的来源;

- 支持可导出CSV格式表格在本地备份。
![20250809_224734.mp4 [video-to-gif output image]](https://cdnfile.sspai.com/2025/08/09/article/79d18c2aee6a56aaeda4eaffc5868c6c.gif)
除了以上功能,我在这个初步的版本还预留了一个导出JSON格式文件的功能,指定了输出的JSON格式,作为输入为与AI整理分析的智能体进行对接做准备。这次产品的「抓手」已经完成。

「大脑」+「载体」:AI分析整理智能体
继续采用对个人使用更为友好的coze,在这个部分,完成「大脑」的搭建,以及「载体」的选中,是支撑整个AI笔记整理助手的核心流程,需要在该部分完成流程如下:

搭建后的整体工作流如下:

JSON输入
工作流的起始的节点,在上一步「抓手」搭建中已经确定输入数据的形式,可使用JSON导出功能导出的示例数据,作为该工作流的入参测试数据。

大模型分析整理
大模型分析整理环节主要使用了大模型的分析节点,这里的重点是提示词的编写,决定你最终想输出的是怎样的一份笔记成果。


我希望 AI 能帮我实现的,是从康奈尔笔记法与费曼学习法中汲取灵感、融合后形成的构想。
- 提炼关键词;
- 将摘录的笔记分类;
- 并帮我做出内容提炼总结;
- 以及能够引导我向别人复述相关的定义。
总结四点,最后输出应具备以下结构:

最后在大模型组件下完成的提示词编写,即完成了大模型分析整理的环节,经过多次测试后,我完成的提示词如下,这里可以按照实际的个人需求进行编写。

输出到载体
该节点主要是输出载体的组件的选择,经调研,发现有两个组件符合我的要求。
第一个是Notion的create_page插件,支持创建一个新页面,用户可以在其中输入想要的内容。而Notion是我最近常用的一个笔记软件,完美符合我的「载体」要求。
但是经过测试后,发现了一个缺点,就是创建的新页面笔记内容被限制在了2000字以内,在我要求记录原文的前提下,2000字远远不够,只能放弃使用该组件。

第二个是飞书云文档的create_document插件,支持创建空文档和带内容的文档,支持 markdown 语法创建。这个插件比Notion更好的是,更长的文本输出,且支持markdown格式,这样能让我的笔记通过整理成markdown格式输出后,就能有完整的格式结构。最后,我也是选择了该插件作为「载体」。

并且用了一个时间插件,作为标题输出。

智能体接入
整个工作流搭建完毕并测试通过后,发布为工作流,供后续的的接口调用。

在扣子API中找到执行工作流,输入自己的的token(具体参考鉴权方式概述 - 文档 - 扣子。)和workflow_id后,将接口复制提供给Augment进行对接,把原有的JSON导出功能改造为调用AI智能体智能体功能。

至此,我获得了我所需要的一个完整形态的AI笔记整理助手,筛选出摘要笔记后,点击AI按钮,触发笔记整理,在飞书中生成整理后的云文档,最终形成一个具备标准格式且具有[关键词]、[笔记原文、来源]、[笔记总结]、[教学尝试]四个模块的可读文档。
最终的实现效果如下:

同时可以在移动端的飞书中查看生成的云文档。

写在最后
AI笔记整理助手「pickit」适用于浏览器阅读的场景,能帮助我整理当日的摘录文本后,在上下班的路上进行查看回顾,并能引导我进行内容复述加强记忆,但仍然存在不少缺点:
- 受限于浏览器场景,无法记录在软件中阅读的文本内容;
- 部分无法进行复制、且服务调用快捷键的网站无法进行记录;
- 只适用于纯文本类的阅读整理,不适用于需要图片保存的场景,也无法进行快照。
感兴趣的朋友可下载已完成的插件,并搭建自己的coze智能体进行接入使用,可直接替换token和workflowID进行使用,具体操作参考压缩包中的智能体调用配置说明.md。
网盘链接: https://pan.baidu.com/s/1CohnmIPaO9kPX3rXZZfoKw?pwd=a82p