Pomiń

Podsumowanie webinaru: Dodaj swojemu chatbotowi głos, który brzmi naturalnie

Opublikowano

PosłuchajPosłuchaj tego artykułu

Agenci czatu to już standard w firmach. Większość firm już je ma albo właśnie tworzy. Mało kto jednak wie, co zrobić, gdy użytkownik woli po prostu porozmawiać.

Nana, jedna z największych superaplikacji w Arabii Saudyjskiej, poszła inną drogą. W Za kulisami: Jak Nana wykorzystuje AI Agents, by zmienić doświadczenie klienta, Karim Mustafa, szef obsługi klienta w Nana, opowiedział, jak wdrożyli AI Agents w całym dziale wsparcia i co się zmieniło w zespole, kosztach i jakości.

Większość zespołów nie pyta już, czy dodać głos, tylko jak to zrobić bez przebudowy wszystkiego od zera.

W

Dlaczego wdrożenie głosu jest trudniejsze, niż się wydaje


Nana zaczęła w 2016 roku jako pionier dostaw zakupów w Arabii Saudyjskiej. Przez lata rozwinęła się w superaplikację z praniem, myciem aut, dostawą jedzenia i nie tylko. Wraz z rozwojem produktu rosła liczba kontaktów od klientów. Zespół miał 54 agentów na zmianach, żeby nadążyć za zgłoszeniami.

Przełom nastąpił, gdy Nana przeszła z botów FAQ i prostych czatów na prawdziwego AI agenta zbudowanego na ElevenLabs. Agent prowadzi rozmowy z klientami bezpośrednio w aplikacji Nana. Rozwiązuje problemy, odpowiada na pytania, śledzi zamówienia i przekazuje sprawy dalej, gdy trzeba. Jakość była od razu widoczna i stała.

Efekt biznesowy był ogromny:

  1. Nana obniżyła koszty obsługi klienta o 85%
  2. Czas odpowiedzi skrócił się do kilku sekund

Technicznie działa, ale rozmowa jest nienaturalna.

Druga połowa problemu to kontekst. Przekazanie historii rozmowy do LLM przy każdej turze jest konieczne, ale niewystarczające. Te same słowa mogą znaczyć coś innego w zależności od tonu – „wszystko w porządku” powiedziane z ulgą i „wszystko w porządku” powiedziane z frustracją to ten sam tekst, ale inna rozmowa. System głosowy, który to ignoruje, zawsze będzie brzmiał trochę sztucznie, niezależnie od jakości modeli.

Dochodzi jeszcze kwestia techniczna. Zespoły, które same zarządzają głosem, muszą stale dbać o logikę zmiany ról, obsługę przerwań i opóźnienia. To nie jest jednorazowa praca.

Głosowe AI rozwiązuje wszystkie trzy: daje spójne odpowiedzi, od razu reaguje na nowe informacje i łatwo się skaluję na dowolną liczbę połączeń.

Jak dodać głos do istniejącego agenta

Najprościej zrobić to przez architekturę z dwoma połączeniami WebSocket.

Karim opisał zmianę w podejściu zespołu do problemów. Gdy pojawia się nowe wyzwanie operacyjne, pytanie nie brzmi już, ilu ludzi potrzeba, tylko jak szybko da się zbudować agenta, który to ogarnie.

Pozostali członkowie zespołu wsparcia mogli wybrać stałe zmiany albo elastyczne godziny powiązane z KPI dla AI. Wszyscy wybrali elastyczny model.

Urban Company korzysta z głosowego AI w trzech głównych obszarach:

  1. Bądź multimodalny. Nana zauważyła, że klienci chcą też pisać, nie tylko dzwonić. Dopasowanie kanału do zachowań klientów ułatwiło wdrożenie i przyspieszyło efekty.
  2. Skup się na jakości promptów, nie tylko technologii.AI odpowiada tak dobrze, jak ją nauczysz. Zespół Karima poświęcił czas na pisanie promptów, które uczyły agenta empatii i odpowiadania w stylu marki.
  3. Przy wdrożeniach po arabsku używaj tashkeel.Dodanie znaków samogłoskowych do tekstu w promptach znacznie poprawia wymowę i naturalność.
  4. Przenieś ludzi wyżej, nie na zewnątrz.Najlepiej wykorzystasz zespół, jeśli będą rozwijać AI, a nie ją zastępować. Daj im wpływ na projektowanie workflow i kontrolę jakości.
  5. Buduj z myślą o skali od początku.Gdy pierwszy agent już działa, ta sama platforma obsłuży połączenia wychodzące, workflow wewnętrzne, reklamy i projekty między działami. Teraz to do działu Nana inne zespoły zgłaszają się, gdy trzeba szybko ruszyć z nowym projektem.
  6. Idź prosto do źródła. Kilku dostawców, których sprawdzała Nana, sprzedawało ElevenLabs z narzutem. Budując bezpośrednio na ElevenLabs, Nana zyskała dostęp do najnowszych modeli, niższych kosztów i wsparcia technicznego.

Na początku sesji wywoływany jest

Instahelptutaj.

nana

Podobne artykuły

Twórz z najwyższej jakości audio AI