如何使用ChatGPT利用语音进行完美笔记?
By Thomas Frank Explains · 2024-03-20
几个月前,我创建了一个机器人,可以将语音记录转录为几乎完美的文本,并自动发送到Notion。这个新工作流程大幅改进了处理长音频文件的能力,现在更容易设置且具有更多定制选项。
全新音频转文字自动化工作流程
- 您好,几个月前我制作了一个机器人,可以像我现在录制的这段语音笔记一样记录语音,将其转录为几乎完美的文本,并自动将该转录与摘要发送到我的笔记数据库Notion。在过去的几个月里,这已经成为我最常用的工作流程之一。我经常在长途步行时通过语音记笔记。但今天,我带给您一个全新且大幅改进的工作流程版本,因为原始版本存在一些问题。首先,设置时间太长。其次,无法处理超长音频文件,大约限制在45分钟。第三,定制选项太少。因此,过去几个月,我全力编程,极大地提升了我的编程技能,带来了一个大大改进的新版本。现在设置要容易得多,可以处理更长的音频文件,两小时的文件现在也不是问题了。最重要的是,现在有更多的定制选项。您可以选择是否显示摘要,选择要获得的摘要列表类型,甚至可以更改摘要的长度和密度。在这个视频中,我将首先免费分享这个工作流程给您使用,然后展示如何准确设置它。设置完成后,您可以使用iPhone的“语音备忘录”应用或基本上任何智能手机语音备忘录应用记下语音备忘录,将其上传到云存储,然后... 接下来将自动使用OpenAI的Whisper端点将其转录为几乎完美的文本,并使用ChatGPT对其进行摘要,并使用我在幕后编写的代码将一切发送到Notion。以下是如何使用我新的入门指南设置这一切,您将在下方描述中找到这一指南,这将使设置这个工作流程变得非常容易。还有一个我忘记提到的重大改进是现在有三个不同版本的工作流程,有一个适用于Dropbox,一个适用于Google Drive,一个适用于Microsoft OneDrive。本视频中我将演示Dropbox版本,但所有三个版本都有多步骤,易于跟随的指南。在下方的描述中查看该链接,您将能够选择任何一个版本跟随操作。开始使用Dropbox,点击这里的链接,这将自动将新版本的工作流程带入您的Pipedream账户。如果您没有Pipedream账户,它基本上是我最喜欢的自动化平台,点击此链接时会提示您创建一个新账户,您可以使用免费计划完美运行这个自动化。您无需升级到Pipedream的付费计划,其免费计划非常实用。我要点击这个链接。
全新音频转文字自动化工作流程
创建Pipedream工作流程和Notion语音笔记项目
- 在这里,我将把工作流程导入到我的Pipedream账户中,然后有这个新的项目功能,所以我将创建这个Notion语音笔记Dropbox项目,然后它将给我命名工作流程的选项。我将保持默认名称并创建工作流程。接着,我们有了触发器要设置,这个触发器会在我们上传新文件到选择的Dropbox文件夹时触发。首先,我将点击此处连接我的Dropbox账户,然后我需要设置路径,即这个自动化将监视的文件夹,所以我会将音频文件上传到特定文件夹,而不仅仅是Dropbox中的任意文件夹。这些设置应该已经为您设置好,您需要检查的是确保include link设置为True,然后我可以点击创建源。接下来,您会看到一个选择事件区域,基本上是要求您上传一个音频文件到Dropbox以生成所谓的测试事件,这个测试事件将用于设置其余的工作流程,测试并部署它,使其生效。在一个步骤中,这基本上向您展示了上传测试音频文件所需的一切,我已经提供了一个链接,因此您可以从我的GitHub账户下载,我已经这样做了。接着,我将简单地将我的示例音频文件拖到我的Dropbox文件夹中。回到Pipedream,我可以进入这个事件选择器,找到相同的音频文件,一旦点击,我会收到一个成功提示,现在我们基本上有了一些触发数据可供其余的自动化使用。如果您想探索,您不必担心任何这些,但我会继续点击继续,并转到我们的Notion语音笔记组件。这基本上是我构建的一个自定义组件,幕后有大量代码,如果您感兴趣,我在GitHub上有实时的代码。它将取代以前我们不得不构建的所有多步骤工作流程来完成此操作。首先,我将连接我的Notion账户,通过这个Notion授权流程。在这个过程中,您要确保首先选择要使用的工作区,我现在要使用这个演示空间,然后选择页面,确保您要么给Pipedream访问您要在Notion中用于此自动化的笔记数据库,要么给它访问包含该数据库的页面,这将使权限级联到该数据库。此自动化适用于任何Notion数据库,所以我将使用我的终极大脑模板作为示例,这是我的集大成之作的大脑模板。
创建Pipedream工作流程和Notion语音笔记项目
优化Notion工作流程的关键步骤
- notion里面有一个任务管理器和一个笔记系统,它与自动化功能非常配合得很好。事实上,你可以使用任何notion数据库。如果你在你的私人页面中创建了一个全新的空白数据库,这个自动化也能够使用。在视频末尾,我将提供更多有关Ultimate Brain的信息,如果你感兴趣并想要支持我的工作的话。现在,让我们勾选Ultimate Brain框,允许访问,现在你可以看到我的notion账户已经与这一步骤连接起来了。这里还有一些说明,请仔细阅读,以防对你有帮助。接下来我们需要添加一个OpenAI API密钥,基本上,OpenAI账户将允许你使用那个whisper端点来转录你的音频,以及使用chat GPT端点来summarize文本转录。你可以通过点击这个小框来连接你的chat GPT账户,然后输入一个来自OpenAI的API密钥。你可以在platform.openai.com上获得这个API密钥。如果你还没有账户,可以创建一个,他们会提供你5美元的免费试用信用,不过值得注意的是,在试用信用用尽后,你需要生成一个新的API密钥,并在添加账单详情后设置。基本上,一旦你进入OpenAI的网站,你会看到右上角的个人链接,进入查看API密钥,然后制作一个新的secret key。在我执行之前,我想快速去账单区域指出这里的使用限制选项卡,所以一旦你添加了账单信息,如果你想确保每个月的花费不会超过一定数量,可以在这里设置一个硬性限制。我默认设置为120,你甚至可以设置得更低,因为这个工作流程的使用成本非常低廉,大约每小时转录音频的成本是40美分,这非常便宜。让我们返回API密钥,你只需要点击创建一个secret key,我会在这里命名为9月19日,然后将那个密钥复制到剪贴板中,并添加到我们的API密钥字段中,保存。接下来,我们可以为这个工作流程设置选项,首先是之前步骤的数据字段,随便留下它的默认设置,接下来是摘要选项,你可以勾选或取消勾选任何一个框,基本上它们会给你不同的列出要点的摘要。需要特别说明的是,摘要选项就只是转录文本的段落摘要,会在转录文本上方显示,而主要要点和行动项,所有这些基本上就是你可以选择打开或关闭的列表,我会暂时将它们保留为默认设置,然后你可以选择。
优化Notion工作流程的关键步骤
设置最终大脑笔记系统的数据库
- 设置您的数据库,这将是最终大脑笔记系统的数据库,您的笔记实际上会被存放在这里。如果您正在使用最终大脑,甚至会看到这里显示的一个小提示信息,指出All Notes是最终大脑记笔记系统使用的数据库。选择好后,会出现一些额外的属性,您唯一需要填写的是笔记标题。我会选择我的数据库中的标题属性,您还可以选择其他属性。例如,如果您的数据库有一个数字类型属性用于跟踪持续时间,您可以选择那个属性。我也为笔记成本做了同样的事情,这将展示您的文本长度和运行整个自动化所需成本。如果您不想在这里显示这些属性,我也将成本信息放在页面底部。我不会设置笔记标签,但您可以设置,同时还可以选择不同的GPT模型。默认情况下,我们将使用最便宜且非常适用于此用例的GPT 3.5 Turbo模型。但如果您愿意,可以选择其中任何一个,包括GPT-4,这是新的16k上下文版本的GPT 3.5,可以处理更多的上下文窗口。但实际上您并不需要,这主要是由于我在幕后做了一些代码优化,将您的音频文件和文本分成片段,然后同时发送这些片段到OpenAI,这样就实现了一切,使您能够转录和处理更长的音频文件,而不会超出Pipedream的超时限制,这在过去一直是我们的主要限制因素。这就是我们需要做的一切,我将进行测试,看看这到底如何运行。这是一些导出信息,您可以查看,如果您好奇的话。然后我会回到Notion,进入我的笔记区域,我们可以看到这里有一个全新的转录:“为什么Pokemon是学习编码的好例子”。这就是如何设置这个系统的方式,如果我们想要在这里添加一些记忆选项,可以来到摘要选项清单,加上故事、参考、论点和相关主题。我们现在做最后一个测试,这是一个成功的消息,回到Notion,我们有一个全新的笔记出现了,现在我们可以看到有很多其他新的部分,包括参考和引文、论点以及转录中需要改进的地方。如果您试图说服别人,启用这个选项会是一个很好的选择,总的来说,当您使用这个工作流程时,您会有更多的自定义选项。说到这一点,我想回过头简要谈一下这个“启用高级选项”的切换按钮,我不会详细介绍我添加的所有内容,但如果您想将这个工作流程发挥到极致,您可以
设置最终大脑笔记系统的数据库
优化自动化工作流程
- 在Pipedream上运行速度更快,或者您想将其用于转录非常长的音频文件,比如三四个小时长,请阅读这些选项,您将开始了解一些可以改变工作流程性能的方法。现在我还具有推送更新到这个特定组件的能力,因此,如果有更新,您实际上会在Notion Voice Notes操作的右上角看到一个红色更新按钮,这将允许您获取更新,而无需重新复制整个工作流程并从头开始设置。当您完成所有设置后,请点击部署按钮,这将使您的工作流程生效,此时工作流程已经准备就绪,处于活动状态,并将开始处理任何上传的音频文件。最后,如果您希望进一步改进这个工作流程,就像我之前提到的,它与我在Notion上的终极大脑模板非常配合,这个工作流程适用于任何Notion数据库,但如果您想要最佳的笔记设定来构建第二大脑,具有内置的日记功能、许多有用的仪表板以及大量其他的生产力功能,如任务管理器、项目仪表板、GTD和Pera集成,那么您要查看ultimatebrain。这就是我在2018年发现Notion时想让Notion成为的样子,一个全方位的个人生产力系统,处理我生活中的一切事务,完全消除了需要在各种不同的生产力应用之间周转。如果您也想拥有同样的超能力,可以到Thomas jfriend.com brain获取您的版本,现在您还可以使用代码let's go 2023获得任何版本减免50美元,与许多其他Notion模板不同,您将发现ultimate brain带有积极的支持,因此,如果您有问题,遇到困难,有新功能的想法,我们有一个拥有Notion认证支持人员的完整支持社区,他们会回答每一个问题,您不会陷入困境。再次访问Thomas jfrank.combrain查看模板并获取您的版本,并确保使用let's go 2023代码获得50美元优惠,感谢您一如既往的观看,我很高兴将这个自动化工作流程组合在一起,如果您有兴趣构建到您的Notion工作区的其他自动化,请在下方评论中告诉我,也请留意我的网站,这里有一个Notion学习菜单,我有各种不同的页面,从基础到数据库再到公式,您可以学习关于Notion的一切,成为专家,并有一个Notion自动化页面,您将找到其他可以构建的自动化,比如将YouTube统计数据带入Notion,用您的语音创建任务,我还没有制作那个视频,但博客文章已经发布,所以请查看,所有链接都在下方描述中,请在Twitter上关注我,希望和我讨论Notion、无代码或者提问,我会在下一个视频中见到您,感谢观看。
优化自动化工作流程
Conclusion:
这一全新工作流程使得转录语音变得更加简单,并增加了更多的功能和选项,让您能够轻松记录语音笔记并自动整理到Notion中。通过优化这一工作流程,您可以更高效地管理您的笔记和信息。