Protocol_03

AI Red Teaming.

Test offensivi su LLM, chatbot, assistenti interni e workflow agentici per verificare prompt injection, jailbreak, leakage di dati e accessi indiretti attraverso strumenti collegati.

Focus Prompt injection, guardrail bypass, unsafe tool calling, data leakage.

Audience Team AI, security, governance e stakeholder che approvano il rilascio.

Result Threat model del sistema e backlog di hardening prima della messa in produzione.

Attack_Vectors

What gets tested

Prompt injection Payload costruiti per deviare il modello e cambiare istruzioni o priorita operative.

Jailbreak Tecniche usate per superare policy e filtri, incluse catene multi-turno o role hijacking.

Context leakage Verifica di fuga di dati sensibili dal contesto, dai tool collegati o da materiale di training.

Operational_Point

Why it fits this site

Il valore non e solo tecnico: un modello non sicuro diventa un nuovo perimetro d'attacco. Per questo la pagina si integra con advisory e reporting, cosi da leggere la sicurezza AI nello stesso linguaggio usato per il resto della superficie esposta.