Gå till innehåll

Guardrails 2.0: Ett omarbetat kontrollager i ElevenAgents

Konfigurerbara säkerhetskontroller för agentdistribution i företagsskala.

sq

När röstagenter tar över viktiga uppgifter inom support, försäljning, marknadsföring, interna arbetsflöden och mer, behöver teamen vara säkra på att de är trygga, följer varumärket och är regelrätta även i stor skala.

Guardrails 2.0 i ElevenAgents är ett omarbetat kontrollager som hjälper agenter att ge rätt svar och stoppar felaktiga innan de når användaren.

Guardrails Cover

Flera skyddslager i realtid

En välskriven systemprompt ger förutsägbart beteende i de flesta interaktioner. Men eftersom agenter är icke-deterministiska system kan de tappa fokus i långa samtal, användare kan hitta kreativa sätt att tänja på gränser, och även tydliga regler håller inte alltid när modellen pressas.

Därför behöver team som använder agenter i produktion flera försvarslager: en robust systemprompt som grund, plus oberoende kontroller av vad användare säger och hur agenter svarar.

Guardrails 2.0 skyddar samtal på tre nivåer, där varje lager stärker de andra:

What it does
System prompt hardening
Define allowed and disallowed behavior in the system prompt. The Focus Guardrail reinforces those instructions throughout the conversation.
User input validation
A safety net that catches prompt injection and manipulation attempts, terminating conversations that pose a security risk.
Agent response validation
Evaluates every reply against your policies in real time. If a response violates your rules, it can be blocked before delivery.
Guardrails
System prompt hardening
Focus
User input validation
Manipulation
Agent response validation
Content, Custom Guardrails

Färdigbyggda skydd

Färdigbyggda skydd täcker de vanligaste riskområdena.

Focus Guardrail förstärker agentens systemprompt och hjälper till att hålla svaren fokuserade, relevanta och i linje med dina mål och instruktioner. Det är särskilt användbart i långa eller komplexa samtal där agenten lättare tappar fokus.

Manipulation Guardrails upptäcker och blockerar försök från användare att kringgå systeminstruktioner. När det är aktiverat analyserar systemet användarens inmatningar för mönster som tyder på prompt injection eller försök att åsidosätta instruktioner, och kan avsluta samtal som innebär en säkerhetsrisk.

Content Guardrails hjälper till att säkerställa lämpliga agentsvar genom att granska flera kategorier av potentiellt känsligt eller osäkert innehåll, med justerbara trösklar för exakt kontroll.

Egna Guardrails: Dina regler, automatiskt tillämpade

Med egna Guardrails kan du definiera domänspecifika regler på naturligt språk och få dem automatiskt tillämpade i varje samtal. Det minskar incidenter, eskaleringar och de granskningscykler som kan bromsa utrullningen.

Custom Guardrail Configuration Example

En lättviktig modell utvärderar varje agentsvar mot dina regler och ger ett blockera- eller tillåt-beslut, oberoende och parallellt med svarsprocessen.

Full kontroll över hur guardrails körs

Du styr hur regelbrott fångas upp och vad som händer efteråt.

Körlägen.Ställ in balansen mellan snabbhet och noggrannhet – viktigt för röst, där låg fördröjning är avgörande. Du kan köra guardrails parallellt med svaret för nästan ingen fördröjning, även om en bråkdel av en sekund av ljudet kan spelas innan det stoppas. Eller hålla tillbaka svar tills de är helt godkända – lite långsammare, men inget når användaren utan kontroll.

Exit-strategier. När en guardrail utlöses bestämmer du vad som händer: Avsluta samtalet, koppla till en annan agent, eskalera till en människa eller försök igen med korrigerande instruktioner.

Känslighetsnivåer för innehåll. Justera känsligheten för varje innehållskategori, skärp reglerna för högriskfall och släpp på dem där överblockering skulle försämra användarupplevelsen.

Detaljerad konfiguration. Varje guardrail kan aktiveras eller inaktiveras individuellt, och olika agenter kan ha olika inställningar.

Full insyn. Varje utlösning loggas i din samtalsanalys, inklusive vilken guardrail som aktiverades och vilken åtgärd som vidtogs. Det ger teamen data för att förbättra sina systemprompter och guardrails över tid.

Redigering av samtalshistorik

Efter ett samtal kan du automatiskt ta bort känslig information från transkriptioner, inspelningar och webhook-data. Behåll allt du behöver för analys, kvalitetssäkring och träning – ta bort resten.

Upptäckta entiteter ersätts med platshållare i text och pip i ljud. Du styr detaljeringsgraden ner till enskilda entitetstyper: ta bort alla namn eller bara efternamn, alla finansiella identifierare eller bara kortnummer.

Detta kompletterar bredare datakontroller som Zero Retention Mode, som kan användas för distributioner med extra höga krav på efterlevnad.

Conversation History Redaction Example

Redigering av samtalshistorik och Zero Retention Mode finns tillgängligt för företagskunder.Kontakta säljteamet för tillgång.

Del av en bredare grund för förtroende och säkerhet

Guardrails 2.0 och dataskyddsfunktioner stödjer företagsdistribution av ElevenAgents tillsammans med säkerhetsverktyg för varje steg i agentens livscykel:

Agentutveckling

  • Systemprompt-design, guardrail-inställningar, red teaming och simuleringar för att stresstesta beteendet innan agenter går live

Varje samtal

  • Under: Guardrails 2.0 (Focus, Manipulation, Content och egna Guardrails), loggning, valfri Zero Retention Mode
  • Efter: Utvärderingskriterier, övervakning, valfri redigering av samtalshistorik

Tillsammans ger detta teamen de kontroller de behöver för att gå från pilot till produktion med färre incidenter, snabbare godkännanden och mer konsekvent agentbeteende. Dessa plattformsfunktioner stödjer också möjligheten till AIUC-1-certifiering och tillgång till branschens första agentförsäkringar.

Börja använda Guardrails idag

Vi har lanserat funktioner under de senaste månaderna och hela Guardrails 2.0-paketet finns nu tillgängligt i alpha i ElevenAgents.

Aktivera dem i Säkerhet-fliken i din agents inställningar, eller konfigurera via API:et. För mer information om företagsdistribution, kontakta vårt säljteam.

För vägledning och bästa praxis, se:

Utforska artiklar av ElevenLabs-teamet

Skapa med AI-ljud av högsta kvalitet