插件+AI的探索，AI笔记整理助手pickit - 少数派

插件+AI的探索，AI笔记整理助手pickit

08/12 07:05

利益相关声明：

什么是利益相关声明：

利益相关声明的准确性和真实性，会影响投稿的最终处理结果——为保证读者准确获取内容创作的背景信息，建议所有作者在提交内容前根据实际情况进行选择声明。少数派鼓励准确披露利益关系、内容有参考价值、观点独立的高质量宣传内容。

作者与文中产品有直接的利益相关（开发者、自家产品等）

前言

本文主要讲述我搭建整个AI笔记整理助手的思路，并在文尾提供已完成的插件文件和通过修改coze密钥来使用自己的智能体的相关指引。

想法的起始

最近在学习一些新的知识，发现日常都是在工作中或者在家中，通过一些论坛或者网站阅读文章后，然后把觉得需要记录的句子或者段落记录下来。

但是我经常性地为了图省事，经常性地直接把文本直接复制到笔记软件里，想着后面回过头来会看一下。时间一长，就发现笔记本里已经堆满了不同的单句、段落，有时候甚至想不起当时为什么会记录这些内容。

把格式也复制下来，笔记排版会更加混乱

不知道是否也有人和我遇见了一样的问题，我回顾一下了我的笔记摘录路径，试图找出是哪个环节造成了这样的情况。

文章阅读：浏览器阅读的文章带有不同的格式的文本，不同网站使用的文本格式更是不同，直接复制粘贴会把格式带上；
文本摘录：通常需要笔记本软件进行辅助，一般会根据当前的记录主题创建目录再进行摘录；如果需要记录来源网址，则需二次记录。
摘录文本整理：一般初步摘录的文本时比较凌乱的，需要时间整理，或者调整格式来达到自己想呈现的笔记效果。
回顾：一般在上班或者下班路上进行回顾，需要能用手机进行阅读；而且面对未整理的文档，阅读欲会大大降低。

归纳了几个我的核心需求点：

网页的阅读环境下能快速摘录文本；
自动按我的想法整理文本，能够帮我加强对某些内容和定义的记忆；
能通过手机进行回顾。

思考过后，想到之前做的一款插件（WordPilot英语学习插件搭建 - 少数派、）可以作为不错的思路延展，既然已经可以记单词，自然也可以做进一步的延展，也用来记录笔记。

基于前面的核心需求点，已经可以有整个大致思路：抓手获取、大脑思考、载体承载结果；我想要的是一个只需要“拾取”（pick it up）就能用起来的工具。

「抓手」：网页插件工具

照例还是使用VS code和augment进行插件开发。

绘制简单的原型图：

原型图草图

编写初步的的PRD文档，确定核心的必要功能，不需要一步到位完整列出所有功能，只需要讲述完整的项目形态，以及能想到的一些功能。

原型和初步的PRD不代表插件的最终形态，只为了给AI有一个整体上的概念，确保产品的关键主干在自己的把控之下，其他部分可以在后续与AI的交流中可以不断完善。

最后在沟通的过程中，完成具备记录功能的插件「Pickit」的初步产品形态，以下为一些核心的功能点：

抽屉式功能悬窗触发；

触发弹窗.mp4 [video-to-gif output image]

部分无限制网站可通过快捷键Alt+p直接获取文本进行摘录，同时记录文本的来源；

20250809_221116.mp4 [video-to-gif output image]

部分限制网站无法使用快捷键（如微信读书、知乎等），可先复制，再粘贴到输入框中保存，也会同时记录下摘录文本的来源；

支持可导出CSV格式表格在本地备份。

20250809_224734.mp4 [video-to-gif output image]

除了以上功能，我在这个初步的版本还预留了一个导出JSON格式文件的功能，指定了输出的JSON格式，作为输入为与AI整理分析的智能体进行对接做准备。这次产品的「抓手」已经完成。

「大脑」+「载体」：AI分析整理智能体

继续采用对个人使用更为友好的coze，在这个部分，完成「大脑」的搭建，以及「载体」的选中，是支撑整个AI笔记整理助手的核心流程，需要在该部分完成流程如下：

搭建后的整体工作流如下：

JSON输入

工作流的起始的节点，在上一步「抓手」搭建中已经确定输入数据的形式，可使用JSON导出功能导出的示例数据，作为该工作流的入参测试数据。

大模型分析整理

大模型分析整理环节主要使用了大模型的分析节点，这里的重点是提示词的编写，决定你最终想输出的是怎样的一份笔记成果。

注意调整最大回复长度

我希望 AI 能帮我实现的，是从康奈尔笔记法与费曼学习法中汲取灵感、融合后形成的构想。

提炼关键词；
将摘录的笔记分类；
并帮我做出内容提炼总结；
以及能够引导我向别人复述相关的定义。

总结四点，最后输出应具备以下结构：

最后在大模型组件下完成的提示词编写，即完成了大模型分析整理的环节，经过多次测试后，我完成的提示词如下，这里可以按照实际的个人需求进行编写。

输出到载体

该节点主要是输出载体的组件的选择，经调研，发现有两个组件符合我的要求。

第一个是Notion的create_page插件，支持创建一个新页面，用户可以在其中输入想要的内容。而Notion是我最近常用的一个笔记软件，完美符合我的「载体」要求。

但是经过测试后，发现了一个缺点，就是创建的新页面笔记内容被限制在了2000字以内，在我要求记录原文的前提下，2000字远远不够，只能放弃使用该组件。

第二个是飞书云文档的create_document插件，支持创建空文档和带内容的文档，支持 markdown 语法创建。这个插件比Notion更好的是，更长的文本输出，且支持markdown格式，这样能让我的笔记通过整理成markdown格式输出后，就能有完整的格式结构。最后，我也是选择了该插件作为「载体」。

并且用了一个时间插件，作为标题输出。

智能体接入

整个工作流搭建完毕并测试通过后，发布为工作流，供后续的的接口调用。

在扣子API中找到执行工作流，输入自己的的token（具体参考鉴权方式概述 - 文档 - 扣子。）和workflow_id后，将接口复制提供给Augment进行对接，把原有的JSON导出功能改造为调用AI智能体智能体功能。

至此，我获得了我所需要的一个完整形态的AI笔记整理助手，筛选出摘要笔记后，点击AI按钮，触发笔记整理，在飞书中生成整理后的云文档，最终形成一个具备标准格式且具有[关键词]、[笔记原文、来源]、[笔记总结]、[教学尝试]四个模块的可读文档。

最终的实现效果如下：

同时可以在移动端的飞书中查看生成的云文档。

写在最后

AI笔记整理助手「pickit」适用于浏览器阅读的场景，能帮助我整理当日的摘录文本后，在上下班的路上进行查看回顾，并能引导我进行内容复述加强记忆，但仍然存在不少缺点：

受限于浏览器场景，无法记录在软件中阅读的文本内容；
部分无法进行复制、且服务调用快捷键的网站无法进行记录；
只适用于纯文本类的阅读整理，不适用于需要图片保存的场景，也无法进行快照。

感兴趣的朋友可下载已完成的插件，并搭建自己的coze智能体进行接入使用，可直接替换token和workflowID进行使用，具体操作参考压缩包中的智能体调用配置说明.md。

网盘链接: https://pan.baidu.com/s/1CohnmIPaO9kPX3rXZZfoKw?pwd=a82p

5

等 5 人为本文章充电

vibe coding爱好者，探索可探索。

全部评论(8)

请在登录后评论...

更多