前言

本文主要讲述我搭建整个AI笔记整理助手的思路,并在文尾提供已完成的插件文件和通过修改coze密钥来使用自己的智能体的相关指引。

想法的起始

最近在学习一些新的知识,发现日常都是在工作中或者在家中,通过一些论坛或者网站阅读文章后,然后把觉得需要记录的句子或者段落记录下来。

但是我经常性地为了图省事,经常性地直接把文本直接复制到笔记软件里,想着后面回过头来会看一下。时间一长,就发现笔记本里已经堆满了不同的单句、段落,有时候甚至想不起当时为什么会记录这些内容。

把格式也复制下来,笔记排版会更加混乱

不知道是否也有人和我遇见了一样的问题,我回顾一下了我的笔记摘录路径,试图找出是哪个环节造成了这样的情况。

  • 文章阅读:浏览器阅读的文章带有不同的格式的文本,不同网站使用的文本格式更是不同,直接复制粘贴会把格式带上;
  • 文本摘录:通常需要笔记本软件进行辅助,一般会根据当前的记录主题创建目录再进行摘录;如果需要记录来源网址,则需二次记录。
  • 摘录文本整理:一般初步摘录的文本时比较凌乱的,需要时间整理,或者调整格式来达到自己想呈现的笔记效果。
  • 回顾:一般在上班或者下班路上进行回顾,需要能用手机进行阅读;而且面对未整理的文档,阅读欲会大大降低。

归纳了几个我的核心需求点:

  • 网页的阅读环境下能快速摘录文本;
  • 自动按我的想法整理文本,能够帮我加强对某些内容和定义的记忆;
  • 能通过手机进行回顾。

思考过后,想到之前做的一款插件(WordPilot英语学习插件搭建 - 少数派、)可以作为不错的思路延展,既然已经可以记单词,自然也可以做进一步的延展,也用来记录笔记。

基于前面的核心需求点,已经可以有整个大致思路:抓手获取、大脑思考、载体承载结果;我想要的是一个只需要“拾取”(pick it up)就能用起来的工具。

「抓手」:网页插件工具

照例还是使用VS code和augment进行插件开发。

绘制简单的原型图:

原型图草图

编写初步的的PRD文档,确定核心的必要功能,不需要一步到位完整列出所有功能,只需要讲述完整的项目形态,以及能想到的一些功能。

原型和初步的PRD不代表插件的最终形态,只为了给AI有一个整体上的概念,确保产品的关键主干在自己的把控之下,其他部分可以在后续与AI的交流中可以不断完善。

最后在沟通的过程中,完成具备记录功能的插件「Pickit」的初步产品形态,以下为一些核心的功能点:

  • 抽屉式功能悬窗触发;
触发弹窗.mp4 [video-to-gif output image]
  • 部分无限制网站可通过快捷键Alt+p直接获取文本进行摘录,同时记录文本的来源;
20250809_221116.mp4 [video-to-gif output image]
  • 部分限制网站无法使用快捷键(如微信读书、知乎等),可先复制,再粘贴到输入框中保存,也会同时记录下摘录文本的来源;
  • 支持可导出CSV格式表格在本地备份。
20250809_224734.mp4 [video-to-gif output image]

除了以上功能,我在这个初步的版本还预留了一个导出JSON格式文件的功能,指定了输出的JSON格式,作为输入为与AI整理分析的智能体进行对接做准备。这次产品的「抓手」已经完成。

「大脑」+「载体」:AI分析整理智能体

继续采用对个人使用更为友好的coze,在这个部分,完成「大脑」的搭建,以及「载体」的选中,是支撑整个AI笔记整理助手的核心流程,需要在该部分完成流程如下:

搭建后的整体工作流如下:

JSON输入

工作流的起始的节点,在上一步「抓手」搭建中已经确定输入数据的形式,可使用JSON导出功能导出的示例数据,作为该工作流的入参测试数据。

大模型分析整理

大模型分析整理环节主要使用了大模型的分析节点,这里的重点是提示词的编写,决定你最终想输出的是怎样的一份笔记成果。

注意调整最大回复长度

我希望 AI 能帮我实现的,是从康奈尔笔记法与费曼学习法中汲取灵感、融合后形成的构想。

  • 提炼关键词;
  • 将摘录的笔记分类;
  • 并帮我做出内容提炼总结;
  • 以及能够引导我向别人复述相关的定义。

总结四点,最后输出应具备以下结构:

最后在大模型组件下完成的提示词编写,即完成了大模型分析整理的环节,经过多次测试后,我完成的提示词如下,这里可以按照实际的个人需求进行编写。

输出到载体

该节点主要是输出载体的组件的选择,经调研,发现有两个组件符合我的要求。

第一个是Notion的create_page插件,支持创建一个新页面,用户可以在其中输入想要的内容。而Notion是我最近常用的一个笔记软件,完美符合我的「载体」要求。

但是经过测试后,发现了一个缺点,就是创建的新页面笔记内容被限制在了2000字以内,在我要求记录原文的前提下,2000字远远不够,只能放弃使用该组件。

第二个是飞书云文档的create_document插件,支持创建空文档和带内容的文档,支持 markdown 语法创建。这个插件比Notion更好的是,更长的文本输出,且支持markdown格式,这样能让我的笔记通过整理成markdown格式输出后,就能有完整的格式结构。最后,我也是选择了该插件作为「载体」。

并且用了一个时间插件,作为标题输出。

智能体接入

整个工作流搭建完毕并测试通过后,发布为工作流,供后续的的接口调用。

在扣子API中找到执行工作流,输入自己的的token(具体参考鉴权方式概述 - 文档 - 扣子。)和workflow_id后,将接口复制提供给Augment进行对接,把原有的JSON导出功能改造为调用AI智能体智能体功能。

至此,我获得了我所需要的一个完整形态的AI笔记整理助手,筛选出摘要笔记后,点击AI按钮,触发笔记整理,在飞书中生成整理后的云文档,最终形成一个具备标准格式且具有[关键词]、[笔记原文、来源]、[笔记总结]、[教学尝试]四个模块的可读文档。

最终的实现效果如下:

同时可以在移动端的飞书中查看生成的云文档。

写在最后

AI笔记整理助手「pickit」适用于浏览器阅读的场景,能帮助我整理当日的摘录文本后,在上下班的路上进行查看回顾,并能引导我进行内容复述加强记忆,但仍然存在不少缺点:

  • 受限于浏览器场景,无法记录在软件中阅读的文本内容;
  • 部分无法进行复制、且服务调用快捷键的网站无法进行记录;
  • 只适用于纯文本类的阅读整理,不适用于需要图片保存的场景,也无法进行快照。

感兴趣的朋友可下载已完成的插件,并搭建自己的coze智能体进行接入使用,可直接替换token和workflowID进行使用,具体操作参考压缩包中的智能体调用配置说明.md

 

网盘链接: https://pan.baidu.com/s/1CohnmIPaO9kPX3rXZZfoKw?pwd=a82p