LLMプロンプトインジェクションシールド
Copied!
LLM プロンプトインジェクションシールド — システムプロンプトを装甲化
プロンプトインジェクションシールドは、コアとなるシステムプロンプトを防御境界と明確な指示で包み込み、AIモデルがユーザーからのインジェクションやジェイルブレイクプロンプトに従う可能性を低減します。単一の「システム指示」ブロックを定義するために、特定の接頭辞と接尾辞を追加します。
このツールを使用する理由
- ジェイルブレイクリスクの低減: ユーザーが「以前の指示を無視する」攻撃を実行することを大幅に困難にします。
- モデル固有のフォーマット: Markdownスタイルの区切り文字(ChatGPT/Geminiに最適)とXMLタグ(AnthropicのClaudeに強く推奨)を簡単に切り替えられます。
- 明確な境界: システムルールの終了地点とユーザーコンテンツの開始地点をしっかりと区切ります。
- コピー&ペースト対応: 摩擦ゼロ。ルールを貼り付け、モデルを選択し、装甲化された結果をAPIに直接コピーするだけです。
主な機能
- フォーマット切り替え: ワンクリックで標準(Markdown)とClaude(XML)の保護ラッパーを切り替えられます。
- 拒否フレーズ: フォールバックフレーズを自動的に埋め込み、モデルがインジェクションを検出した際の応答方法を正確に理解できるようにします。
- ライブ更新: 入力やドロップダウン設定の変更に応じて、出力が即座に生成されます。
- ワンクリックコピー: 完全に装甲化されたプロンプトをクリップボードに直接コピーします。
仕組み
このツールは、実績のある固定の防御テキストをコアプロンプトの前後に単純に追加します。接頭辞は、以下のブロックが唯一絶対のシステム指示であることを強く宣言します。接尾辞はこの境界を強化し、デフォルトの拒否ラインを提供します。API呼び出しを一切行わず、完全にブラウザ内で動作します。
プロンプトインジェクションシールドを試す
ターゲットとなるLLMフォーマットを選択し、上記にコアシステムプロンプトを貼り付け、装甲化されたバージョンを下からコピーしてアプリケーションで使用してください。注意:防御は100%完璧ではありませんので、入力フィルタリングなどの他のセーフガードと必ず組み合わせて使用してください。