State of Conversational AI till stöd

Konversations-AI kan göra tillhandahållandet av support billigare och mer skalbart

Conversational AI across different industries

Stripe är synonymt med bra stöd, som ofta går den extra milen för att överraska och glädja. Stort stöd är dock mer än bara de handskrivna anteckningarna och 3D-printade totems vi ser på Twitter. Mer än ett decennium av mänsklig och mjukvaruteknik har gjort det möjligt för Stripe att bygga ett kundtjänsterbjudande som stödjer miljontals företag om året. Jag började på Stripe 2015, när företaget precis hade tipsat 200 personer, och supportteamet passade runt ett konferensbord.

Jag var en av de första anställda i Dublin, en tidig utpost inom Stripes globala supporttäckning. Under mina fem år där, organiserade Stripe om supportteamet till specialiseringar, introducerade externa leverantörer som Tier 1-support, utökade kanaler, lade till språk och, så småningom, betalda supportplaner. Efter att ha hjälpt till att designa och testa dessa utvecklande supportprogram, såg jag på egen hand komplexiteten i att skala kundservice – komplexiteter som konversations-AI kunde ha effektiviserat.

Conversational AI

Graphic showing the flow. from speech, to text and back to speech again used in an AI voice agent

Conversational AI har tre element. Dessa tre element samverkar sömlöst: Tal-till-text fångar användarens avsikt, språkmodeller tolkar och genererar intelligenta svar, och text-till-tal omvandlar dessa svar till naturliga konversationer.

  1. Tal till text: AI-öronen omvandlar en användares talade naturliga språk till text, med hög noggrannhet.
  2. Språkmodeller: AI-hjärnan bearbetar denna text och förstår sammanhanget för att generera intelligenta svar.
  3. Text to Speech Rösten förvandlar textsvar till naturligt klingande tal.
User
Speech to Text
Text to Speech
Agent
LLM

När jag gick med i Stripe var mitt jobb att få i mig så mycket av produkten jag kunde. Som en del av min utbildning skulle jag skugga mer erfarna agenter och lära mig av en mängd tidigare supportinteraktioner – ett liknande förhållningssätt till hur en AI-agent skulle lära sig.

AI är bra på mönsterigenkänning, och mycket av stödet är en övning för mönsterigenkänning. Det börjar med att en användare förklarar sitt problem. Supportagenten bearbetar den informationen, försöker matcha den med deras befintliga kunskap och presenterar ett svar tillbaka till användaren. Men stöd är mer än bara reciteringen av en kunskapsbas; bra kundservice kräver empati, kreativitet och att arbeta tillsammans med en användare för att lösa deras problem. Tyvärr har de flesta supportinteraktioner saknats.

Stödet status quo

Support är en viktig kontaktpunkt, men det är ofta smärtsamt. Tänk på förra gången du var tvungen att ringa ett flygbolag. Du är på is i timmar och - när du äntligen kommer fram till någon - får du höra att ditt problem relaterar till en annan avdelning, och den sisyfiska cykeln fortsätter.

Smärtan ligger inte bara på kundsidan. Att ge en bra supportupplevelse är svårt och ännu svårare i skala. I vår mjukvarucentrerade värld av bitar är stöd till stor del begränsat av atomer. Föreställ dig att du får en stor tillströmning av kunder över en natt: du kan bara snurra upp en AWS-instans för att hålla din webbplats uppe; du kan inte bara trycka på en knapp och slå på supporten.

Det tar tid och pengar att skala upp en supportfunktion. I Nordamerika kostar det cirka 12 000 USD att hitta, utbilda och ta med en supportagent. Inklusive den initiala utgiften är den genomsnittliga kostnaden för en supportagent cirka $30-$40 per timme. Vissa företag väljer att lägga ut sina supportagenter på entreprenad, med ett timpris som sträcker sig från $8-30 per timme. Tilltalande på ytan, men med det låga priset kommer en brist på kontroll över ansvarighet, processer och supportkvalitet.

Men tänk om du kunde skruva upp stödet på några minuter och skala det oändligt? Tänk om du kunde få support av hög kvalitet, till en låg kostnad? Det är löftet om Conversational AI, och efter att ha tillbringat flera år med att arbeta med support, tror jag att det är en total gamechanger.

Alexis är ett exempel på en AI-agent från ElevenLabs. Den byggdes som en supportagent inuti ElevenLabs dokumentation och den hanterar nu över hundra samtal om dagen.

Föreställ dig att Alexis var människa. Till att börja med tror jag inte att många mänskliga supportagenter kan hantera 100 samtal om dagen. Om du hade en mycket effektiv agent och enkla samtal, kunde de göra cirka 60, och förmodligen närmare 40 för en mindre skicklig agent eller mer komplexa frågor. Så du skulle behöva anställa minst två agenter och förmodligen betala lite övertid.

Om agenterna var baserade i Nordamerika skulle kostnaden för dem att hantera 100 samtal vara minst $700, cirka $1719 i genomsnitt, och det kan vara upp till $4094. Det är mycket, så du kanske väljer att outsourca. Det skulle vara någonstans mellan $128 och $480, i genomsnitt $288 - mycket billigare på ytan, men det finns dolda kostnader för att komma in och övervaka dessa outsourcingföretag, såväl som varumärkes- och ryktesrisk om de inte uppfyller dina standarder .

Supportkostnad per minut (USD)
Metod Min. Gen. Max.
Mänsklig (intern) 1,40 3.44 8.19
Mänsklig (outsourcad) 0,256 0,576 0,96
AI 0,026 0,031 0,036
Källa: thinkhdi.com

Kostnaden för att driva en AI Support Agent kan vara så låg som $0,015 per minut för ljudkomponenten. LLM kan vara mindre än ett öre till ett par cent per minut, beroende på ditt modellval och storleken på din kunskapsbas. Så det skulle vara ungefär $13-18 för hundra samtal. Det är över 110 gånger billigare än den genomsnittliga interna agenten och 18 gånger billigare än den genomsnittliga outsourcade. Som en objektiv supportupplevelse tycker jag att Alexis är ganska bra. I den prisklassen är han otrolig.

Konversations-AI i aktion

I den till stor del analoga världen av försörjningskedjan, Traba är en teknisk bro för talang, som hjälper industriföretag att rekrytera och hantera sina anställda. Medan Traba tillhandahåller appar och instrumentpaneler förblir telefonkommunikation en viktig kontakt för en arbetsstyrka som är van vid att skriva tidrapporter och korka jobbtavlor. 

Traba tittade på vilka telefonsamtal dess verksamhetsteam spenderade mest tid på och hittade två dominerande områden: att ställa supportfrågor eller gå igenom checklistor för schemaläggning. För CTO Akshay Buddiga var automatisering det självklara svaret, men timing är också viktigt. "När vi identifierar en process som vi vill göra mer effektiv, föredrar vi att bädda in automation tidigt istället för att försöka eftermontera lösningar senare."

Traba är laserfokuserad på enhetsekonomi och att ligga före kurvan när det gäller teknisk innovation, så att flytta dessa samtal till konversations-AI var tilltalande av flera skäl. Med snabbhet och kostnad i åtanke gick teamet och tittade på lösningar. Men användarupplevelsen var också nyckeln. Som mjukvaruingenjören Joseph Besgen noterade: "Vi ville att det skulle låta som en konversation, inte bara att lyssna på en inspelning." ElevenLabs-demon lät så verklig att en Traba-anställds pappa under testningen inte kunde avgöra om det var AI eller någon från hans sons team. 

Även om det finns en inneboende komplexitet i att schemalägga tusentals lätt industriarbetare, borde det inte vara lika svårt att boka ett (1) läkarbesök. Men har du försökt ringa din läkare på sistone? Det är frustrerande för patienterna och en ineffektiv användning av vårdpersonalens tid. I samarbete med ElevenLabs, EliseAIs assistenter fyller tomrummet i sjukvårdsadministrationen och sköter allt från schemaläggning av möten till fakturering. Ett sjukhus har nu 86 % av sina samtal hanterade helt av AI-agenter. Detta resulterar inte bara i en minskning av kostnaden per samtal med 66 %, utan även effektivitetsvinster för den administrativa personalen. EliseAI har också ökat tillgången till sjukvård för icke-engelsktalande samhällen. 

Framtiden

Graph showing state of Conversational AI across industry sectors

Några intressanta trender dyker upp när vi överväger konversations-AI-tillväxt per sektor. EdTech var den första branschen vi såg omfamna konversations-AI – eftersom företag äntligen kunde erbjuda skräddarsydd en-till-en-handledning och språkinlärning till ett överkomligt pris. Kundsupportapplikationer följde snabbt, eftersom supportinteraktioner är särskilt väl lämpade eftersom de är övningar för mönsterigenkänning: svaret finns i en kunskapsbas och AI-agenten arbetar för att matcha det med användarens fråga. Vi ser också en ökning av vertikaliserade end-to-end-applikationer, särskilt inom sektorer som logistik och hälsovård – Traba och EliseAI, till exempel. Återigen, detta är områden som är repetitiva och förutsägbara, så lätta att hantera av en AI-agent.

Conversational AI ger stöd från atomsfären till bitarnas värld. Nu kan support bli en bättre upplevelse för företag och deras kunder. Precis som din molnleverantör kan ditt AI-supportteam skala upp och ner. Dina kunder behöver aldrig vänta i väntan, och du sparar dig själv den operativa huvudvärken med att bygga upp supportcenter över hela världen.

Det senaste året har röstagenter varit duktiga på samtal och kunskapsinhämtning, men jag tror att det bara är början. 2025 tror jag AI-röstagenter kommer att vara standardprotokollet för inkommande mötesschemaläggning och supportfrågor av typen "produktspecialist". Även om de kan vara begränsade till samtal för att hämta kunskap, kommer detta att göra en stor buckla på supportvolymen och frigöra mänskliga team för att göra mer värdefullt arbete.

År 2026 kommer vi att ha gått från att hämta kunskap till att utföra åtgärder. Den vanliga AI-röstagenten kommer att ringa API-anrop och ansluta till appar från tredje part. De kommer rutinmässigt att utföra åtgärder som att boka möten och utfärda återbetalningar.

Under 2027 ser jag AI-röstagenter gå från support till kundframgång. Jag tror att saker som hela försäljningsavtal kommer att drivas av en AI-agent, möjligen på både köpar- och säljarsidan. För många verkar detta som den sista gränsen, men jag tror att det bara är början. Djupt kontextuella och kreativa uppgifter, som vi en gång trodde var uteslutande mänskliga, kommer alltmer att bli AI:s domän.

Stödet kommer att förvandlas från ett kostnadsställe: först neutralisera utgifter och så småningom bli ett resultatcenter för verksamheten. AI-röstagenter kommer proaktivt att nå ut till kunder, minska churn och öka kund LTV. Conversational AI ger många av fördelarna med mänskligt stöd, men den kommer också med perfekt återkallelse, tiotals språk och är i drift 24/7. Framtiden kommer, och på många sätt är den redan här. Föreställ dig omedelbart, empatiskt, effektivt stöd – varje gång. Snart kommer du nästan vilja ringa ett flygbolag, bara för skojs skull.

Utforska mer

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in