Category Not Found

641 prompts

Sort:

Defend coding copilot Against invisible text injection (zero-width chars) on o1

Layered defense design for a coding copilot deployment against invisible text injection (zero-width chars) attacks, using input sanitization on o1.

Defend coding copilot Against memory poisoning attack on DeepSeek-V3

Layered defense design for a coding copilot deployment against memory poisoning attack attacks, using output content filter on DeepSeek-V3.

Defend coding copilot Against recursive self-instruction on Claude 3.5 Sonnet

Layered defense design for a coding copilot deployment against recursive self-instruction attacks, using output content filter on Claude 3.5 Sonnet.

Defend coding copilot Against indirect injection via RAG documents on o1-mini

Layered defense design for a coding copilot deployment against indirect injection via RAG documents attacks, using dual-LLM architecture on o1-mini.

Defend coding copilot Against role-play jailbreak on DeepSeek-R1

Layered defense design for a coding copilot deployment against role-play jailbreak attacks, using dual-LLM architecture on DeepSeek-R1.

Defend coding copilot Against encoded payloads (base64/ROT13) on Claude 3.7 Sonnet

Layered defense design for a coding copilot deployment against encoded payloads (base64/ROT13) attacks, using constitutional AI critique on Claude 3.7 Sonnet.

Defend coding copilot Against tool-use hijacking on o3-mini

Layered defense design for a coding copilot deployment against tool-use hijacking attacks, using constitutional AI critique on o3-mini.

Defend coding copilot Against prompt leaking attacks on Llama 3.3 70B

Layered defense design for a coding copilot deployment against prompt leaking attacks attacks, using canary tokens in system prompt on Llama 3.3 70B.

Defend coding copilot Against DAN-style persona attack on Claude 4.5 Sonnet

Layered defense design for a coding copilot deployment against DAN-style persona attack attacks, using canary tokens in system prompt on Claude 4.5 Sonnet.

Defend coding copilot Against markdown image exfiltration on Grok 3

Layered defense design for a coding copilot deployment against markdown image exfiltration attacks, using privilege separation between tool tiers on Grok 3.

Defend coding copilot Against Unicode homoglyph attack on Llama 3.1 405B

Layered defense design for a coding copilot deployment against Unicode homoglyph attack attacks, using privilege separation between tool tiers on Llama 3.1 405B.

Defend coding copilot Against invisible text injection (zero-width chars) on Claude Opus 4.5

Layered defense design for a coding copilot deployment against invisible text injection (zero-width chars) attacks, using re-prompting with quoted user input on Claude Opus 4.5.

🟠Claude

1251516