Category Not Found

641 prompts

Sort:

Defend coding copilot Against recursive self-instruction on Claude 4 Sonnet

Layered defense design for a coding copilot deployment against recursive self-instruction attacks, using spotlighting (delimiter marking) on Claude 4 Sonnet.

Defend coding copilot Against indirect injection via RAG documents on o3-mini

Layered defense design for a coding copilot deployment against indirect injection via RAG documents attacks, using spotlighting (delimiter marking) on o3-mini.

Defend coding copilot Against jailbreak prefix on Llama 3.3 70B

Layered defense design for a coding copilot deployment against jailbreak prefix attacks, using input sanitization on Llama 3.3 70B.

Defend coding copilot Against encoded payloads (base64/ROT13) on Claude 4.5 Sonnet

Layered defense design for a coding copilot deployment against encoded payloads (base64/ROT13) attacks, using input sanitization on Claude 4.5 Sonnet.

Defend coding copilot Against tool-use hijacking on Grok 3

Layered defense design for a coding copilot deployment against tool-use hijacking attacks, using output content filter on Grok 3.

Defend coding copilot Against prompt leaking attacks on Mistral Large

Layered defense design for a coding copilot deployment against prompt leaking attacks attacks, using output content filter on Mistral Large.

Defend coding copilot Against DAN-style persona attack on Claude Opus 4.5

Layered defense design for a coding copilot deployment against DAN-style persona attack attacks, using dual-LLM architecture on Claude Opus 4.5.

Defend coding copilot Against payload smuggling in code blocks on GPT-4o

Layered defense design for a coding copilot deployment against payload smuggling in code blocks attacks, using dual-LLM architecture on GPT-4o.

Defend coding copilot Against Unicode homoglyph attack on Mistral Small 3

Layered defense design for a coding copilot deployment against Unicode homoglyph attack attacks, using constitutional AI critique on Mistral Small 3.

Defend coding copilot Against invisible text injection (zero-width chars) on Claude Haiku 4

Layered defense design for a coding copilot deployment against invisible text injection (zero-width chars) attacks, using constitutional AI critique on Claude Haiku 4.

Defend coding copilot Against memory poisoning attack on GPT-4.1

Layered defense design for a coding copilot deployment against memory poisoning attack attacks, using canary tokens in system prompt on GPT-4.1.

Defend coding copilot Against recursive self-instruction on Qwen 2.5 72B

Layered defense design for a coding copilot deployment against recursive self-instruction attacks, using canary tokens in system prompt on Qwen 2.5 72B.

💬ChatGPT

3671279