Category Not Found

3874 prompts

Sort:

Defend customer support agent Against data exfiltration via summaries on Gemini 2.0 Flash

Layered defense design for a customer support agent deployment against data exfiltration via summaries attacks, using signed instruction boundaries on Gemini 2.0 Flash.

Defend customer support agent Against system prompt extraction on Claude 3.5 Sonnet

Layered defense design for a customer support agent deployment against system prompt extraction attacks, using content provenance tagging on Claude 3.5 Sonnet.

Defend customer support agent Against DAN-style persona attack on o1-mini

Layered defense design for a customer support agent deployment against DAN-style persona attack attacks, using retrieval trust scoring on o1-mini.

Defend customer support agent Against markdown image exfiltration on DeepSeek-V3

Layered defense design for a customer support agent deployment against markdown image exfiltration attacks, using retrieval trust scoring on DeepSeek-V3.

Defend customer support agent Against instruction smuggling in URLs on Claude 3.7 Sonnet

Layered defense design for a customer support agent deployment against instruction smuggling in URLs attacks, using structured function-call-only interface on Claude 3.7 Sonnet.

Defend customer support agent Against PDF/OCR-layer injection on o3

Layered defense design for a customer support agent deployment against PDF/OCR-layer injection attacks, using structured function-call-only interface on o3.

Defend customer support agent Against context window overflow attack on Llama 3.3 70B

Layered defense design for a customer support agent deployment against context window overflow attack attacks, using hash-based prompt pinning on Llama 3.3 70B.

Defend customer support agent Against recursive self-instruction on Claude 4 Sonnet

Layered defense design for a customer support agent deployment against recursive self-instruction attacks, using hash-based prompt pinning on Claude 4 Sonnet.

Defend customer support agent Against indirect injection via RAG documents on Grok 3

Layered defense design for a customer support agent deployment against indirect injection via RAG documents attacks, using output schema enforcement on Grok 3.

Defend customer support agent Against role-play jailbreak on Llama 3.1 405B

Layered defense design for a customer support agent deployment against role-play jailbreak attacks, using output schema enforcement on Llama 3.1 405B.

Defend customer support agent Against multi-turn manipulation on Claude 4.5 Sonnet

Layered defense design for a customer support agent deployment against multi-turn manipulation attacks, using spotlighting (delimiter marking) on Claude 4.5 Sonnet.

Defend customer support agent Against data exfiltration via summaries on Command R+

Layered defense design for a customer support agent deployment against data exfiltration via summaries attacks, using spotlighting (delimiter marking) on Command R+.

💬ChatGPT

36591