Claude 4の隠されたAI指示がAnthropicの制御方法を明らかに
独立系AI研究者のSimon Willisonが、AnthropicのClaude 4のシステムプロンプトを分析し、モデル制御の詳細を明らかにしました。
最新の更新
日曜日、独立系AI研究者のSimon Willisonは、Anthropicが新たに公開したClaude 4のOpus 4およびSonnet 4モデルのシステムプロンプトに関する詳細な分析を発表し、Anthropicがモデルの「振る舞い」を出力を通じてどのように制御しているかについての洞察を提供しました。Willisonは、公開されたプロンプトと漏洩した内部ツールの指示を調査し、彼が「これらのツールを最も効果的に使用するための非公式なマニュアル」と呼ぶものを明らかにしました。
Willisonが話している内容を理解するには、システムプロンプトとは何かを説明する必要があります。ClaudeやChatGPTを動かすような大規模言語モデル(LLM)は、「プロンプト」と呼ばれる入力を受け取り、そのプロンプトの最も可能性の高い続きとして出力を返します。システムプロンプトは、AI企業が各会話の前にモデルに与える指示で、モデルがどのように応答すべきかを設定します。
好きかもしれない
- SalesforceがInformaticaを80億ドルで買収
- サム・アルトマンのスタートアップが人間確認ロボットを発表、虹彩スキャンで確認
- Mozilla、2026年に32ビットLinux版Firefoxのサポート終了を発表
- Apple、iPhone車の鍵機能を13の新しい自動車ブランドに拡大
- NASA、コロンビア号遺物保存施設を一般公開終了 職員追悼に重点を移行
- AWS、新たなインシデント報告ツールを発表、クラウド障害の中で皮肉な反応を引き起こす
- 『Microsoft Flight Simulator 2024』、12月にPS5で発売決定 PSVR2対応は2026年に登場
- フォートナイト、ダース・ベイダーの成功を受けてAI搭載NPCをクリエイターに提供