Pomiń

Guardrails 2.0: Nowa warstwa kontroli w ElevenAgents

Konfigurowalne zabezpieczenia dla wdrożeń agentów gotowych na potrzeby firm.

sq

Gdy agenci głosowi wspierają obsługę, sprzedaż, marketing czy wewnętrzne procesy, zespoły muszą mieć pewność, że wszystko będzie bezpieczne, zgodne z marką i wymaganiami firmy.

Guardrails 2.0 w ElevenAgents to nowa warstwa kontroli, która pomaga agentom udzielać właściwych odpowiedzi i blokować te niewłaściwe, zanim dotrą do użytkownika.

Guardrails Cover

Wielopoziomowe zabezpieczenia w czasie rzeczywistym

Dobrze przygotowany prompt systemowy daje przewidywalne zachowanie w większości rozmów. Ale agenci nie są w pełni przewidywalni – w dłuższych rozmowach mogą zbaczać z tematu, użytkownicy potrafią obchodzić zasady, a nawet najlepsze polityki nie zawsze działają pod presją.

Dlatego wdrażając agentów na produkcji, potrzebujesz kilku warstw ochrony: mocnego promptu systemowego jako bazy oraz niezależnych kontroli tego, co mówi użytkownik i jak odpowiada agent.

Guardrails 2.0 chroni rozmowy na trzech poziomach, które wzajemnie się uzupełniają:

What it does
System prompt hardening
Define allowed and disallowed behavior in the system prompt. The Focus Guardrail reinforces those instructions throughout the conversation.
User input validation
A safety net that catches prompt injection and manipulation attempts, terminating conversations that pose a security risk.
Agent response validation
Evaluates every reply against your policies in real time. If a response violates your rules, it can be blocked before delivery.
Guardrails
System prompt hardening
Focus
User input validation
Manipulation
Agent response validation
Content, Custom Guardrails

Gotowe zabezpieczenia

Wbudowane zabezpieczenia obejmują najczęstsze obszary ryzyka.

Focus Guardrail wzmacnia prompt systemowy agenta, pomagając utrzymać odpowiedzi na temat, zgodne z twoimi celami i instrukcjami. To szczególnie ważne w długich lub złożonych rozmowach, gdzie agent łatwiej może zboczyć z kursu.

Manipulation Guardrails wykrywają i blokują próby obchodzenia instrukcji systemowych przez użytkowników. Po włączeniu system analizuje wypowiedzi użytkownika pod kątem prób podmiany promptu lub łamania zasad i może zakończyć rozmowę, jeśli wykryje zagrożenie.

Content Guardrails pomagają zadbać o właściwe odpowiedzi agenta, sprawdzając wiele kategorii potencjalnie wrażliwych lub niebezpiecznych treści. Każdą kategorię możesz ustawić osobno.

Własne Guardrails: Twoje zasady, automatyczne egzekwowanie

Własne Guardrails pozwalają ustalić zasady dla twojej branży w zwykłym języku i automatycznie je egzekwować w każdej rozmowie. Dzięki temu ograniczasz incydenty, eskalacje i czasochłonne kontrole zgodności.

Custom Guardrail Configuration Example

Lekki model sprawdza każdą odpowiedź agenta według twoich zasad i decyduje, czy ją zablokować, czy przepuścić – działa niezależnie i równolegle z generowaniem odpowiedzi.

Pełna kontrola nad działaniem Guardrails

Sam decydujesz, jak wykrywać naruszenia zasad i co się dzieje dalej.

Tryby działania.Ustaw balans między szybkością a rygorem – to kluczowe w rozmowach głosowych, gdzie liczy się opóźnienie. Możesz uruchomić Guardrails równolegle z odpowiedzią (prawie bez opóźnienia, choć ułamek sekundy dźwięku może się pojawić przed blokadą) albo wstrzymać odpowiedź do pełnej weryfikacji – trochę wolniej, ale nic nie dotrze do użytkownika bez sprawdzenia.

Strategie zakończenia. Gdy Guardrail zadziała, decydujesz co dalej: zakończ rozmowę, przekaż do innego agenta, eskaluj do człowieka lub spróbuj ponownie z poprawioną instrukcją.

Poziomy czułości treści. Ustaw czułość osobno dla każdej kategorii treści – możesz zaostrzyć kontrolę tam, gdzie ryzyko jest większe, a poluzować tam, gdzie zbyt częste blokady pogorszyłyby doświadczenie użytkownika.

Szczegółowa konfiguracja. Każdy Guardrail możesz włączyć lub wyłączyć osobno, a różni agenci mogą mieć różne ustawienia.

Pełna widoczność. Każde uruchomienie Guardrail jest zapisywane w analityce rozmów – widać, który Guardrail zadziałał i jaka była reakcja. Dzięki temu zespoły mogą z czasem lepiej dopracować prompty i Guardrails.

Anonimizacja historii rozmów

Po zakończeniu rozmowy możesz automatycznie usuwać wrażliwe dane z transkrypcji, nagrań i webhooków. Zostawiasz to, co potrzebne do analizy, QA i treningu, a resztę usuwasz.

Wykryte dane są zastępowane placeholderami w tekście i dźwiękiem w audio. Sam decydujesz o szczegółowości: możesz ukryć wszystkie imiona lub tylko nazwiska, wszystkie dane finansowe lub tylko numery kart.

To działa razem z innymi kontrolami danych, jak Tryb braku retencji, który możesz włączyć przy bardziej rygorystycznych wymaganiach zgodności.

Conversation History Redaction Example

Anonimizacja historii rozmów i Tryb braku retencji są dostępne dla klientów biznesowych.Napisz do sprzedaży, żeby uzyskać dostęp.

Część szerszych zabezpieczeń i zaufania

Guardrails 2.0 i funkcje prywatności wspierają wdrożenia ElevenAgents w firmach razem z narzędziami bezpieczeństwa na każdym etapie pracy agenta:

Tworzenie agenta

  • Projektowanie promptu systemowego, konfiguracja Guardrails, testy red teaming i symulacje do sprawdzania zachowania przed uruchomieniem agenta

Każda rozmowa

  • W trakcie: Guardrails 2.0 (Focus, Manipulation, Content i własne Guardrails), logowanie, opcjonalny Tryb braku retencji
  • Po rozmowie: Kryteria oceny, monitoring, opcjonalna Anonimizacja historii rozmów

Dzięki temu zespoły mają kontrolę, by przejść z pilotażu do produkcji z mniejszą liczbą incydentów, szybszą akceptacją i bardziej przewidywalnym zachowaniem agentów. Te podstawy platformy wspierają też uzyskanie certyfikatu AIUC-1 i dostęp do pierwszych na rynku polis ubezpieczeniowych dla agentów.

Włącz Guardrails już dziś

Od kilku miesięcy wdrażamy nowe funkcje, a pełny pakiet Guardrails 2.0 jest już dostępny w wersji alpha w ElevenAgents.

Włącz je w zakładce Bezpieczeństwo w ustawieniach agenta, albo skonfiguruj przez API. Jeśli chcesz dowiedzieć się więcej o wdrożeniach dla firm, napisz do naszego zespołu sprzedaży.

Jak skonfigurować i najlepsze praktyki znajdziesz tutaj:

Przeglądaj artykuły zespołu ElevenLabs

Twórz z najwyższej jakości audio AI