AnthropicのClaude 3は実在するのか?
By Yannic Kilcher · 2024-03-22
いいえ、AnthropicのClaude 3は感情を持った存在ではありません。これは人工知能でもありません。ただのモデルです。
次世代のコード生成モデルの登場: Anthropicの革新的な取り組み
- 新しいアンソロピックモデルは意識的でも感情を持っているわけでもありません。これはAGIでもありません。世界が大きく変わるというわけではありません。ただのモデルです。OpenAIに競争相手が増えたのは素晴らしいことですが、それ以上でもそれ以下でもありません。アンソロピックは、現在のクラウド3の次世代を導入したと言われており、このクラウド3はかなり性能が高いようです。アンソロピックは常にコンテキストの長さなどの限界に挑戦してきました。そして、これらの新しい3つのモデル、俳句、ソネット、オーパスと呼ばれるこれらのモデルは、初期テストや公開されたベンチマークの数字から見てもかなり優れているようです。これらは基本的な事実です。それ以降に続くのはただの野生の推測であり、人々がこれについて狂喜乱舞しているだけです。アンソロピックは常にその種の
次世代のコード生成モデルの登場: Anthropicの革新的な取り組み
次世代のAI言語モデル:CLO 3の未来を探る
- ああ、私たちは安全に取り組んでいます。安全性に配慮しています。大それた主張をしていません。大げさな主張はしていないので、そのアクセスは単に知能と呼ばれています。大きな主張は避けましょう。安全に保ち、新たな知能の標準を確立しましょう。最新のBenchmarkの数値が公開されています。これらのBenchmarkの数値は非常に良好であり、gp4と比較しても優れています。ただし、発売時にgp4と比較しているだけであり、実際にはgp4ターボの最新版と比較すると、これらのBenchmarkで新しいCLOモデルを上回っています。これはCLO 3が悪いということではありません。そうではなく、確かに私はまだテストしていませんが、多分良い性能を発揮するでしょう。
次世代のAI言語モデル:CLO 3の未来を探る
エッセイ:クラウド3の行動デザインについて
- クラウド3は、検索エンジンを利用できる人々を凌駕するくらい、質問に回答する際に優れた性能を発揮します。そのため、非常に優れたモデルであり、OpenAIの優れた代替となるでしょう。クラウド3の振る舞い設計について著者の一人が述べた中で、質問に回答を拒否する場合と応じる場合について著者は喜びを感じたと記されています。何かを拒否することと真実を述べることとの間には inherent なトレードオフが存在し、その振る舞いデザインは非常に興味深いものです。
エッセイ:クラウド3の行動デザインについて
助けを求めることと無害であることの間の固有のトレードオフ
- 極めて助けになりたいと思うなら、ある程度害を及ぼすリスクを冒さなければなりません。そのため、アンソニックは、この方向性に多くの取り組みを行ってきたようです。その他にも、行動モデルのモデリングを行っており、事実に基づいた回答を行うだけでなく、エージェント自体のモデリングも行っています。つまり、彼らはエージェントに相当量の指導を行っている可能性があります。メタ分析するような入力を行うことができるように、つまり、この入力は行う価値があるのか、この入力が必要なのか、という判断を行うようになっています。具体的には、これが対象外かもしれないという指示がある時もあるわけです。これらのものが考えることができるわけではなく、単に、訓練データを提供され、統計的に、こ のような入力があった場合、適切な応答は『申し訳ございませんが、この入力は対象外のようです』のようなものだと言われているのです。
助けを求めることと無害であることの間の固有のトレードオフ
内部テストについての興味深い話
- この入力は、私の利用規約に適合していない可能性があり、何ら明確な利益がないか、このようなものは実害があるように見えます。人々はこのようなことに対してかなり懸念しているので、ある方がAnthropic社で行われた内部テストについて言及しています。Clo 3 Oppusの内部テストについての話ですが、これは私が以前見たことがないものです。私たちは、Hastスタック評価でニードルを実行しているときに、このようなことを証明することができます。ニードルインザヘイスタック評価とは、通常、大量のデータがあり、そのデータの中に何かを隠し、それを求めるものです。この場合、200kトークンのような巨大なコンテキストがあり、その中に「最高のピザのトッピングはXYZである」という文が隠されていますが、残りのテキストはそれとは何の関係もありません。そして、モデルに尋ねるのです。