何时应该选择Claude 3而不是ChatGPT?
By The AI Advantage · 2024-03-07
Claude 3相对于ChatGPT来说具有哪些优势呢?这篇博客将为您详细介绍Claude 3的特点以及其在实际使用场景中的表现。
Claw-Free:GBD-4杀手?
- Claw-Free是另一个号称比GBD-4在基准测试中更优越的大型语言模型,Anthropic声称如此,而根据互联网上的很多实际情况也是如此。
- Claw-Free具有类似GBD-4的特点,但其基础模型在某些使用场景下表现非常出色。
- 作者详细测试了Claw-Free并认为,与其相比GBD-4是大型语言模型领域的佼佼者,但是现在也许已经有所改变。
- 重点来了:作者首先快速概述了Claw-Free的规格和对可用性的影响,并深入探讨了其在日常使用场景中的表现,尤其是在内容创建辅助和创意生成方面。
Claw-Free:GBD-4杀手 ?
Claf Free 新旗舰 Opus
- 在讨论规格之前,我首先想向大家展示一个可以免费使用的网站。
- 你可以前往 chat.LMS y.org,这里可以直接进行对话并选择 Claf Free Opus,这是他们的新旗舰型号。
- 他们发布了多个型号,你可以查看所有细节,视频不会总结他们发布的博客帖子,虽然里面包含了很多信息,比如赢得所有基准测试。
- 但在实际使用中,它并不比其他型号更好,对我这样一个重度用户来说,基准测试的胜负并不重要,我更关心的是定价、速度和输出的质量。
- 基本上是每月 20 美元的价格,但这个网站允许你免费使用,虽然有时会有点过载,但免费嘛,你可以去试试。你还可以前往 Arena side by side 网站,与 gp4 进行比较,并在此运行提示,获取 gp4 和免费的输出,这挺疯狂的。
- 他们有风险投资,他们希望创建一个聊天机器人的排行榜,目前非常成功,这是评估不同型号的最佳方法之一,每两到三周更新一次。
- 所以,作为一个身处欧洲的人,这是一个可以不使用 VPN 就能使用的方法。即将说到的下一点是,如果你想使用免费版本的 Claf,它在欧洲是不可用的,而最佳型号 Opus 被 20 美元的付费墙封住。
- 这些是作为用户最重要的一些要点。
Claf Free 新旗舰 Opus
GPT 模型的上下文窗口
- GPT 模型现在具有 200k 的上下文窗口,而在使用 GPT 进行聊天时,上下文窗口为 32k。
- 使用 gb4 API 的 128k 上下文窗口时,情况就不那么完美了,有时中间的信息会丢失。
- 针对这一情况,它们进行了所谓的 "needle in a hyack" 的基准测试,其中他们在非常长的文档中隐藏一小行文本,然后提示模型检索这一信息。这个测试很重要,因为它展现了模型如何检索隐藏的信息。
- 虽然 Web 界面在很多方面不如 chat GPT,但其核心产品是它的回答能力。
- 对于一些基本的提示,比如让它写一篇文章或者研究某个主题,它的表现与 gb4 模型基本相当。
- 以上观点纯属主观看法,来自一个花费大部分时间进行实验的高级用户的视角。
GPT 模型的上下文窗口
重要提示的背后
- 当提供更多的上下文时,可以期待定制的、更相关的输出
- 使用自定义指令和丰富的数据图片,即使是简单的提示也能得到令人印象深刻的结果
- 数据可以辅助决策,但最终决定更多取决于感觉和直觉
重要提示的背后
GPT模型和生成性AI
- GPT模型展示了如何在对话中建立上下文和记忆,表现出多步交互。
- 与其他大型语言模型进行对比,AI工具的周刊是其中一个重要内容。
- 作者提供了大量的内容说明,但他的重点是生成性AI,特别是Chat GPT。
- 他强调关注当下和可用的技术,而不是人工智能的历史。
- 定制说明明确表示重点是生成性AI,尤其是Chat GPT。
GPT模型和生成性AI
深度学习技术的视觉能力
- 深度学习技术在视觉方面的能力值得关注。与GPT 4V相比,Opus在视觉能力上表现更加出色,通过基准测试可以看出它的优势。
- 与其他模型不同的是,Opus从基础上就是多模态的,而不是简单地将语言模型和视觉模型组合在一起。在处理图像时,Opus的性能更加突出。
- 在比较复杂的图像上,Opus在图像识别方面表现更好,尤其是对于复杂的场景和细节,Opus呈现出了更高的准确性。
- 对于职业应用和自动化场景来说,Opus的视觉处理能力将会发挥重要作用,尤其是在无需人工干预的自动生成过程中。
深度学习技术的视觉能力
使用图像作为提示的效益
- 使用图像作为提示对我来说非常重要,因为它是简单快捷的方式,能够提供大量的上下文信息。
- 我经常使用提示模型来提高效率,尤其是处理需要重复任务时,但如果只是临时性的任务,我会选择直接使用图像作为提示。
- 对于许多行业,如增长黑客等,我用图像提示模型进行了深入的测试,并且不断在不同的场景中使用它来发现新的用途。
使用图像作为提示的效益
人工智能(AI)模型比较
- 我喜欢使用自定义指令来为聊天GPT寻找新的任务,这种方式是我最喜欢的。我运行了多次,并且发现它的性能非常均衡,CL4和GPT-4都表现得很好。
- CL4的输出受限,每次大约生成22个提示,但这并不影响我继续生成。而CLA有更多的标记输出,这一点是很不错的。
- 我有一套工作流程,可以根据特定上下文改进提示,而结果是更详细、更有操作性,更有效地保留了变量,这是我想要的。基于多个提示和工作流程的改进,我的结论是,如果要进行提示工程,CLA实际上更好。
- 我进行了测试...
人工智能(AI)模型比较
对比GPT和CLA:生成提示的比较
- 生成提示可以用于创建逼真的图像,其中输入简短的描述,系统即可生成丰富的细节,便于定制化。
- 研究发现,对于大型语言模型的生成提示,GPT和CLA之间并没有本质区别,两者本质上是相同的。
- 然而,一些测试显示CLA在某些情况下表现更好,但也有例外,比如有时会出现完全错误的情况。
- 某些情况下,CLA的表现会比GPT更胜一筹,但在一些特定测试中,两者的表现都不尽如人意,仍需更多实践和测试来得出结论。
对比GPT和CLA:生成提示的比较
AI模型的发展
- 整个行业都知道,AI模型的评估基于基准测试,虽然声称基准测试问题不包括在训练数据中,但训练数据并非公开。
- 以前,几乎所有的L模型都无法生成贪吃蛇游戏,但现在每个小型模型都可以做到,因为它们知道人们会尝试并展示它们的能力。
- 还有一个创作者的特定提示是通过问澄清问题并生成特定角色来增强聊天体验,尤其是当你不太了解如何使用提示时。虽然手动设置可能更有效,但这是一个很好的起点。
- 有人测试了这个提示,结果让人惊讶,因为它的作用超出预期。
AI模型的发展
人工智能模型的局限性
- 这个模型是你可以依靠的,但它的缺点是很多功能都不能使用。很多人设建模的功能,比如告诉它扮演某个特定的角色,都不起作用,因为它被告知不接受任何角色扮演,他们这样做是为了防止越狱。
- 现在是2024年3月,依然有办法越狱gbd4,也许不是完全地,但你今天可以做很多事情。但是在Claude上这一切都行不通,他们在这方面非常严格。所以这个模型根本不起作用,这是一个很大的局限性。
- 我所使用的很多提示都是以人设建模为基础的。现在在我这个频道上教的自定义指令,有很多关于如何创建自定义指令的视频,以及在教学构建gpts时也都有相关视频。所有这些依然有效,因为我没有采用这种角色扮演的方式,而是创建了这种AI优势模式,其中有24个构建模块代表人设的不同方面。它从来不会直接告诉你“嘿,你是XYZ”,而更多是“嘿,这是我的职业,这是我的目标,这是我的语言偏好”等等,而且这在所有的语言模型上都适用,而在Claude上这样的人设提示是行不通的。
- 最后要提到的是创意写作。这个问题真的很难判断,因为我觉得这是非常主观的,而且我需要更多时间才能有一个我愿意分享的坚定见解。我最初的想法是,对于内容创作来说,它和gbd4可能甚至更糟,这只是我的最初直觉,因为当你用gbd4创建内容并规划内容时,它更像是一名导演,对我来说,它承担了更多的责任,而Claude只是给你文字,而且并不出色。
人工智能模型的局限性
对CLA使用的个人见解
- 我个人对内容有着非常高的标准,所以我绝对不会使用AI为我生成的脚本。
- 但正如我之前提到的,我非常喜欢CLA,特别是在创意方面表现得非常出色。
- 对于头脑风暴和创意生成,CLA将成为我的首选。
- 在关键时刻,它展现出巨大的优势,并且在提示改进方面表现得更加出色。
- 在我试用并且我日常使用的情况下,我得出了初步结论。
- 我会将CLA的标签添加到书签中,并确保它就在Cat GPT旁边。
- 我会同时使用两者,并且会对那些我尚未尝试过的用例进行测试。
- 因为在某些方面,CLA似乎更加优秀。
- 每当我想要输入一张图片作为上下文时,我会默认选择CLA。
- 说实话,这种情况经常发生,因为我在提示中经常使用图片。
- 希望这些信息对你有所帮助。
- 作为一个一直在密切关注CLA的人,我可以肯定地说,在不久的时间内,他们会发布下一个重大更新。
- CLA现在可免费使用,将与OpenAI展开竞争,因为它表现得太出色了。
- 我相信,我不是唯一一个得出这样结论的人。
- 期待你的看法,欢迎在下方留言。
- 你如何看待CLA?你是否比使用GPT更多?你更喜欢在哪些情况下使用GPT或CLA?
- 让我们把评论区变成一个头脑风暴的地方。
- 如果你看到这里,这里有一个视频,或许你会喜欢,因为它向你展示了如何从头开始构建一个GPT。
- 我需要休息一下了,今天比较这两个工具花了太多时间了。
- 我们下次再见。
对CLA使用的个人见解
Conclusion:
通过深入比较Claude 3和ChatGPT,我们发现在某些情况下,Claude 3表现更加出色。无论您是重度用户还是新手,本篇博客将为您解答何时应该选择Claude 3而不是ChatGPT的疑惑。