![](/_next/image?url=https%3A%2F%2Feleven-public-cdn.elevenlabs.io%2Fpayloadcms%2F7e4jzkgwzf-DALL%C3%82%C2%B7E%202024-10-24%2010.20.24%20-%20A%20futuristic%20scene%20showcasing%20multiple%20conversational%20AI%20agents%2C%20represented%20as%20sleek%20digital%20interfaces%20or%20holograms%2C%20each%20with%20distinct%20color%20scheme.webp&w=3840&q=95)
Stan sztucznej inteligencji konwersacyjnej w zakresie wsparcia
Konwersacyjna sztuczna inteligencja może sprawić, że świadczenie wsparcia będzie tańsze i bardziej skalowalne
Stripe to synonim świetnego wsparcia, często robiącego coś więcej, by zaskoczyć i zachwycić klientów. Jednak wielkie wsparcie to coś więcej niż tylko odręcznie pisane notatki i totemy drukowane w 3D, które widzimy na Twitterze. Ponad dekada pracy inżynierów oprogramowania i ludzi pozwoliła firmie Stripe stworzyć ofertę obsługi klienta, która wspiera miliony firm rocznie. Dołączyłem do Stripe w 2015 roku, gdy firma dała napiwki zaledwie 200 osobom, a cały zespół wsparcia mieścił się przy jednym stole konferencyjnym.
Byłem jednym z pierwszych pracowników w Dublinie, jednym z pierwszych oddziałów globalnego wsparcia Stripe. W ciągu pięciu lat, kiedy tam pracowałem, Stripe zreorganizowało zespół wsparcia, dokonując specjalizacji, wprowadziło zewnętrznych dostawców jako wsparcie pierwszego poziomu, rozszerzyło kanały, dodało języki i ostatecznie wprowadziło płatne plany wsparcia. Pomagając w projektowaniu i testowaniu tych rozwijających się programów wsparcia, miałem okazję przekonać się na własne oczy, jak skomplikowane są procesy skalowania obsługi klienta — jak skomplikowane procesy można by usprawnić dzięki sztucznej inteligencji konwersacyjnej.
![Schemat sztucznej inteligencji konwersacyjnej](https://elevenlabs.io/_next/image?url=https%3A%2F%2Feleven-public-cdn.elevenlabs.io%2Fpayloadcms%2Fghs9e3s1oe-s1hrjw6jw6-Conv20AI20Blog20Cover.webp&w=1080&q=95)
Sztuczna inteligencja konwersacyjna składa się z trzech elementów. Te trzy elementy doskonale ze sobą współdziałają: Funkcja zamiany mowy na tekst rozpoznaje intencje użytkownika, modele językowe interpretują i generują inteligentne odpowiedzi, a funkcja zamiany tekstu na mowę przekształca te odpowiedzi w naturalną rozmowę.
- Mowa na tekst: uszy AI konwertują naturalny język mówiony przez użytkownika na tekst z dużą dokładnością.
- Modele językowe: mózg sztucznej inteligencji przetwarza tekst i rozumie kontekst, aby generować inteligentne odpowiedzi.
- Tekst na mowę: głos przekształca odpowiedzi tekstowe w mowę brzmiącą naturalnie.
- Ruch naprzemienny: Specjalna usługa monitoruje wszelkie zakłócenia i dba o to, aby rozmowa przebiegała naturalnie i miała charakter ludzki.
Kiedy dołączyłem do Stripe, moim zadaniem było zapoznanie się z jak największą ilością produktu. W ramach mojego szkolenia obserwowałem pracę bardziej doświadczonych agentów i uczyłem się z licznych wcześniejszych interakcji ze wsparciem — było to podobne podejście do tego, w jaki sposób uczyłby się agent AI.
Sztuczna inteligencja świetnie radzi sobie z rozpoznawaniem wzorców, a duża część wsparcia polega na ćwiczeniu rozpoznawania wzorców. Wszystko zaczyna się od wyjaśnienia problemu przez użytkownika. Agent wsparcia przetwarza te informacje, próbuje dopasować je do swojej wiedzy i przedstawia odpowiedź użytkownikowi. Jednakże wsparcie techniczne to coś więcej niż tylko recytowanie bazy wiedzy; doskonała obsługa klienta wymaga empatii, kreatywności i współpracy z użytkownikiem w celu rozwiązania jego problemu. Niestety, większość interakcji z pomocą techniczną jest niewystarczająca.
Status quo wsparcia
Wsparcie jest ważnym punktem kontaktu, ale często bywa bolesne. Przypomnij sobie ostatnią sytuację, kiedy musiałeś zadzwonić do linii lotniczych. Czekasz na połączenie godzinami i — gdy w końcu udaje ci się dodzwonić do kogoś — dowiadujesz się, że twój problem dotyczy innego działu. I tak syzyfowy cykl się powtarza.
Problem nie dotyczy tylko klienta. Zapewnienie doskonałego wsparcia jest trudne, a na dużą skalę jeszcze trudniejsze. W naszym świecie bitów, w którym dominuje oprogramowanie, obsługa jest w dużej mierze ograniczona do atomów. Wyobraź sobie, że z dnia na dzień odnotowujesz duży napływ klientów: możesz po prostu uruchomić instancję AWS, aby utrzymać swoją witrynę w trybie online; nie możesz po prostu włączyć wsparcia i włączyć go jednym ruchem.
Rozbudowa funkcji wsparcia wymaga czasu i pieniędzy. W Ameryce Północnej znalezienie, przeszkolenie i zatrudnienie agenta pomocy technicznej kosztuje około 12 000 dolarów. Uwzględniając początkowe wydatki, średni koszt zatrudnienia agenta wsparcia wynosi około 30–40 dolarów za godzinę. Niektóre firmy decydują się na outsourcing swoich agentów wsparcia, a stawka godzinowa waha się od 8 do 30 dolarów. Na pierwszy rzut oka wygląda to zachęcająco, ale za niską ceną idzie brak kontroli nad rozliczalnością, procesami i jakością wsparcia.
A co, gdyby można było w ciągu kilku minut uruchomić wsparcie i skalować je w nieskończoność? A co jeśli mógłbyś mieć wysokiej jakości wsparcie za niską cenę? To jest obietnica Conversational AI, a po latach pracy w dziale wsparcia uważam, że to całkowicie zmienia zasady gry.
Alexis jest jednym z przykładów agenta AI z ElevenLabs. Został zbudowany jako agent wsparcia wewnątrz dokumentacji ElevenLabs i obecnie obsługuje ponad sto połączeń dziennie.
Wyobraź sobie, że Alexis jest człowiekiem. Na początek muszę powiedzieć, że nie sądzę, aby wielu agentów pomocy technicznej było w stanie obsłużyć 100 połączeń dziennie. Gdyby miał Pan bardzo sprawnego agenta i jasne zapytania, mógłby Pan obsłużyć około 60 osób, a prawdopodobnie bliżej 40 osób w przypadku mniej doświadczonego agenta lub bardziej złożonych zapytań. Musiałbyś więc zatrudnić co najmniej dwóch agentów i zapewne zapłacić im za nadgodziny.
Gdyby agenci mieszkali w Ameryce Północnej, koszt obsługi 100 połączeń wyniósłby co najmniej 700 dolarów, średnio około 1719 dolarów, a mógłby sięgnąć nawet 4094 dolarów. To sporo, więc możesz zdecydować się na zlecenie tego na zewnątrz. Kwota ta wyniesie od 128 do 480 dolarów, średnio 288 dolarów — na pierwszy rzut oka jest to o wiele tańsze, ale istnieją ukryte koszty związane z wdrażaniem i nadzorem tych firm outsourcingowych, a także ryzyko utraty marki i reputacji, jeśli nie spełnią one Twoich standardów.
Koszt uruchomienia agenta wsparcia AI może wynieść zaledwie 0,015 USD za minutę w przypadku komponentu audio. Koszt LLM może wynieść mniej niż pensa lub kilka centów za minutę, zależnie od wybranego modelu i rozmiaru bazy wiedzy. Tak więc za sto połączeń zapłacimy około 13–18 dolarów. To ponad 110 razy taniej niż przeciętny agent wewnętrzny i 18 razy taniej niż przeciętny agent zewnętrzny. Jeśli chodzi o obiektywne doświadczenie wsparcia, myślę, że Alexis jest naprawdę świetna. Za tę cenę jest niesamowity.
Konwersacyjna sztuczna inteligencja w akcji
W świecie łańcucha dostaw, który jest w dużej mierze analogowy, Traba jest technologicznym pomostem dla talentów, pomagającym przedsiębiorstwom przemysłowym w rekrutacji i zarządzaniu pracownikami. Choć Traba oferuje aplikacje i panele sterowania, komunikacja telefoniczna pozostaje kluczowym sposobem łączenia pracowników, którzy przyzwyczajeni są do papierowych arkuszy czasu pracy i korkowych tablic ogłoszeń o pracę.
Firma Traba przeanalizowała, którym połączeniom telefonicznym jej zespół operacyjny poświęca najwięcej czasu, i ustaliła, że dwa obszary są najważniejsze: odpowiadanie na zapytania dotyczące pomocy technicznej i przeglądanie list kontrolnych dotyczących planowania. Dla dyrektora ds. technicznych, Akshaya Buddigi, oczywistą odpowiedzią była automatyzacja, jednak ważny jest także czas. „Kiedy zidentyfikujemy proces, który chcemy usprawnić, wolimy wdrożyć automatyzację na wczesnym etapie, niż próbować później dostosowywać rozwiązania”.
Traba koncentruje się przede wszystkim na ekonomii jednostkowej i wyprzedzaniu trendów w dziedzinie innowacji technologicznych, więc przeniesienie tych połączeń do sztucznej inteligencji konwersacyjnej było dla niej kuszące z wielu powodów. Mając na uwadze szybkość i koszty, zespół zaczął szukać rozwiązań. Ale kluczowe było również doświadczenie użytkownika. Jak zauważył inżynier oprogramowania Joseph Besgen: „Chcieliśmy, żeby brzmiało to jak rozmowa, a nie jak zwykłe słuchanie nagrania”. Demo ElevenLabs brzmiało tak realistycznie, że podczas testów ojciec jednego z pracowników Traby nie był w stanie stwierdzić, czy to sztuczna inteligencja, czy ktoś z zespołu jego syna.
Choć planowanie pracy tysięcy pracowników przemysłu lekkiego wiąże się z pewną złożonością, umówienie wizyty u jednego (1) lekarza nie powinno być aż tak trudne. A czy ostatnio próbowałeś zadzwonić do swojego lekarza? Jest to frustrujące dla pacjentów i nieefektywne wykorzystanie czasu personelu medycznego. We współpracy z ElevenLabs, EliseAI Asystenci wypełniają lukę w administracji służby zdrowia, zajmując się wszystkim, od umawiania wizyt po wystawianie rachunków. W pewnym szpitalu 86% zgłoszeń obsługują obecnie wyłącznie agenci sterowani sztuczną inteligencją. Efektem jest nie tylko 66-procentowa redukcja kosztów połączeń, ale także wzrost wydajności pracy personelu administracyjnego. EliseAI zwiększyło również dostęp do opieki zdrowotnej dla społeczności nieanglojęzycznych.
Przyszłość
![Graph showing state of Conversational AI across industry sectors](/_next/image?url=https%3A%2F%2Feleven-public-cdn.elevenlabs.io%2Fpayloadcms%2Foemow4rq7qk-h9ep5otgzgw-ConversationalVoiceAI2024.webp&w=3840&q=95)
Gdy przyjrzymy się rozwojowi sztucznej inteligencji konwersacyjnej w poszczególnych sektorach, pojawiają się pewne interesujące trendy. EdTech była pierwszą branżą, w której zaczęto stosować konwersacyjną sztuczną inteligencję – firmy mogły wreszcie oferować dostosowane do potrzeb korepetycje indywidualne i naukę języków obcych w przystępnej cenie. Niedługo później pojawiły się aplikacje do obsługi klienta, ponieważ interakcje z pomocą techniczną są szczególnie dobrze przystosowane, gdyż stanowią ćwiczenia w rozpoznawaniu wzorców: odpowiedź znajduje się w bazie wiedzy, a agent AI dopasowuje ją do pytania użytkownika. Obserwujemy również wzrost liczby wertykalizowanych aplikacji kompleksowych, szczególnie w takich sektorach jak logistyka i opieka zdrowotna – na przykład Traba i EliseAI. Ponownie, są to obszary powtarzalne i przewidywalne, z którymi agent AI może sobie łatwo poradzić.
Conversational AI przynosi wsparcie ze świata atomowego do świata bitów. Teraz firmy i ich klienci mogą cieszyć się lepszym wsparciem. Podobnie jak Twój dostawca usług w chmurze, Twój zespół wsparcia AI może skalować się w górę i w dół. Twoi klienci nie będą musieli już czekać na połączenie, a Ty zaoszczędzisz sobie trudu związanego z uruchamianiem centrów wsparcia na całym świecie.
Przez ostatni rok agenci głosowi świetnie radzili sobie z prowadzeniem rozmów i wyszukiwaniem informacji, ale myślę, że to dopiero początek. Wierzę, że w 2025 r. Agenci głosowi AI będzie standardowym protokołem dla planowania spotkań przychodzących i problemów ze wsparciem typu „specjalista ds. produktu”. Choć połączenia te mogą ograniczać się do pobierania informacji, to jednak znacznie zmniejszy to liczbę zgłoszeń wymagających wsparcia i pozwoli zespołom ludzkim zająć się pracą o większym znaczeniu.
Do 2026 roku przejdziemy od zdobywania wiedzy do wykonywania działań. Standardowy asystent głosowy AI będzie wykonywał wywołania API i łączył się z aplikacjami innych firm. Będą rutynowo wykonywać takie czynności, jak umawianie spotkań i zwracanie pieniędzy.
Widzę, że w 2027 roku agenci głosowi korzystający ze sztucznej inteligencji przejdą od wsparcia do obsługi klienta. Uważam, że za całą transakcję sprzedaży będzie odpowiadał agent sterowany sztuczną inteligencją, być może zarówno po stronie kupującego, jak i sprzedającego. Dla wielu wydaje się to ostateczną granicą, ale moim zdaniem to dopiero początek. Zadania głęboko kontekstowe i kreatywne, które kiedyś uważaliśmy za zarezerwowane wyłącznie dla ludzi, będą w coraz większym stopniu domeną sztucznej inteligencji.
Wsparcie przekształci się z ośrodka kosztów: najpierw neutralizującego wydatki, a ostatecznie stającego się ośrodkiem zysku dla przedsiębiorstwa. Konsultanci głosowi korzystający ze sztucznej inteligencji będą proaktywnie kontaktować się z klientami, co zmniejszy wskaźnik rezygnacji i zwiększy wartość klienta (LTV). Sztuczna inteligencja konwersacyjna zapewnia wiele korzyści płynących ze wsparcia człowieka, ale charakteryzuje się także doskonałą pamięcią, obsługuje dziesiątki języków i może działać 24 godziny na dobę, 7 dni w tygodniu. Przyszłość nadchodzi i w wielu aspektach jest już tutaj. Wyobraź sobie natychmiastową, empatyczną i skuteczną pomoc – za każdym razem. Wkrótce będziesz chciał zadzwonić do linii lotniczych, ot tak, dla zabawy.
Odkryj więcej
![](/_next/image?url=https%3A%2F%2Feleven-public-cdn.elevenlabs.io%2Fpayloadcms%2F7e4jzkgwzf-DALL%C3%82%C2%B7E%202024-10-24%2010.20.24%20-%20A%20futuristic%20scene%20showcasing%20multiple%20conversational%20AI%20agents%2C%20represented%20as%20sleek%20digital%20interfaces%20or%20holograms%2C%20each%20with%20distinct%20color%20scheme.webp&w=3840&q=95)
![](/_next/image?url=https%3A%2F%2Feleven-public-cdn.elevenlabs.io%2Fpayloadcms%2Fksh1575w6nm-DALL%C3%82%C2%B7E%202024-12-21%2016.33.50%20-%20A%20high-quality%20conceptual%20illustration%20representing%20a%20non-human%20conversational%20AI%20agent%20without%20any%20human-like%20features.%20The%20image%20features%20a%20glowing.webp&w=3840&q=95)
Tworzenie pierwszego konwersacyjnego agenta AI: Poradnik dla początkujących
Prosty przewodnik po tworzeniu hiperrealistycznego, konwersacyjnego agenta AI.