Hlasová AI loni udělala obrovský pokrok
Brzy již možná nepoznáte, že mluvíte s robotem
Není tomu tak dávno, co se na voiceboty často pohlíželo jako na doplněk, který nedokázal plně využít potenciál automatizace v zákaznickém servisu. Díky prudkému rozvoji velkých jazykových modelů (LLM) se ale dnes situace rychle mění. Voiceboti už umějí vést plynulou konverzaci téměř k nerozeznání od lidského operátora, dokážou se přizpůsobit konkrétnímu zákazníkovi a výrazně zvyšují efektivitu odbavování dotazů. Hlasová AI se za poslední rok dramaticky vyvinula a přinesla řadu výhod i nových výzev. Firmy tak stojí na prahu technologické transformace, která může výrazně zlepšit zákaznickou péči, a měly by tuto příležitost využít co nejdříve.
Zejména poslední dva roky byly v oblasti konverzačních AI obzvláště zlomové. Když jsme s Microsoftem a Deloitte počátkem roku 2024 pořádali konferenci o využití LLM v komunikaci se zákazníky, mezi experty panoval poměrně jednotný názor – jazykové modely sice mají potenciál, ale na reálné nasazení ještě nejsou dostatečně zralé. Uplynul pouhý rok a situace se dramaticky změnila. Dnes už tyto modely běží v produkci napříč odvětvími a staly se klíčovou součástí zákaznické péče i interních firemních procesů. Sami jsme viděli, jak byl vývoj nesmírně rychlý – od GPT 3.5 přes GPT 4 až po 4o a 4o-mini, které přinesly nejen vyšší přesnost odpovědí, ale také lepší porozumění specifikům češtiny. A to vše při zachování stejné ceny, což znamená, že za stejné množství peněz dnes firmy získávají výrazně vyšší kvalitu. Letos se snad také dočkáme GPT-5, což opět posune hranice.
Umělá inteligence je sice na zákaznických linkách čím dál běžnější, ale pořád ji brzdí několik nedostatků – vysoká latence, etická dilemata a konverzační plynulost. Otázkou již ale není, jestli hlasové asistenty vůbec zavádět, ale jak je doladit k dokonalosti.
Zákaznická péče s AI je konkurenční výhoda
Zákazníci, kteří při interakci s firmou komunikují s umělou inteligencí, nemusejí čekat ve frontě na operátora a dostávají přesnější a personalizovanější odpovědi. Voiceboti navíc dovedou zanalyzovat sentiment, rychle projít historii zákazníků a dynamicky se přizpůsobovat.
Jejich cílem není nahradit lidské operátory, ale usnadňovat jim práci. Umělá inteligence se dokáže postarat o repetitivní a jednoduché dotazy, a operátoři se pak mohou soustředit na složitější problémy, které vyžadují odbornou pomoc. Výsledkem jsou spokojenější zákazníci a efektivnější podpora.
Vnímáme, že si volající na nový standard rychle zvykají a brzy začnou okamžitou a personalizovanou zákaznickou péči vyžadovat. Voiceboti pohánění AI už nejsou pouze experimentální technologie, ale důležitá součást podnikání, se kterou se můžete odlišit od konkurence.
Navíc už přestávají být výsadou call center a rozšiřují se i mimo tradiční zákaznické linky do firem. Bavíme se o moderních bankách, logistických firmách a e-shopech, které dlouze vyčkávaly, než tato technologie uzraje. V zahraničí ji ale využívají například i v některých zdravotnických zařízeních, kde pomocí AI určují pořadí pacientů, odpovídají na základní zdravotní dotazy nebo připomínají plánované zákroky.
Stále je ale na čem pracovat
Hlasová AI se vyvíjí raketovým tempem, ale od dokonalosti ji stále dělí několik překážek. Jedna z největších je latence. Hlasový asistent, který si s odpovědí dává příliš načas, působí nadmíru roboticky. Pokud chcete, aby odpovědi zněly přirozeně, a zvyšovaly tak spokojenost zákazníků, voicebot musí odpovídat v reálném čase. Navíc když se mezi sebou baví dva lidi, málokdy je jejich konverzace lineární – neustále se přerušujeme, objasňujeme a přepínáme z myšlenky na myšlenku uprostřed věty. Pokud má být konverzace s AI přirozená, musí umět zpracovávat informace tímto lidským, chaotickým způsobem.
Další výzva, kterou musíme překonat, je přechod z přepisování mluvené řeči pomocí AI na skutečnou hlasovou konverzační AI. Většina hlasových asistentů totiž dodnes přepisuje mluvenou řeč zákazníka na text, který pak zpracovává a následně vygeneruje textovou odpověď, tu pak převede do mluvené řeči. Jazykové modely mají také tendenci neustále, a často i zbytečně, rozvíjet konverzaci, čímž prodlužují průměrnou délku hovoru. V zákaznické podpoře je efektivita alfou a omegou. Voiceboti se proto musí naučit méně vykecávat a poznat, kdy je správná doba ukončit hovor.
Na světě je několik kulturně a jazykově podobných zemí a národů, například Česko a Slovensko nebo Rusko a Ukrajina, které by dokázaly využít dvojjazyčnou podporu. Zákaznická podpora by v těchto koutech světa proto měla umět přirozeně přepínat z jednoho jazyka nebo dialektu do druhého. V tomto směru už vidíme nějaký pokrok, ale stále se jedná o jednu z největších překážek pro celosvětové škálování voicebotů.
Je v pořádku zatajit, že mluvíte s robotem?
Díky startupům, jako je například ElevenLabs, se hlasový projev robotů stává pomalu, ale jistě nerozeznatelný od lidského projevu. Tento startup narušil monopol Microsoftu a Googlu na generování lidské řeči. Dnes si díky němu můžete nechat vygenerovat unikátní hlas během pár minut. Pokud máte slušné nahrávací studio a kvalitního voice talenta, tak za deset minut může voicebot znít jako on.
Takto vyspělá technologie s sebou již přináší jistá etická úskalí. Měly by mít firmy povinnost informovat zákazníky, že mluví s umělou inteligencí, a ne s člověkem? Jak mohou být ohledně této skutečnosti firmy transparentní bez ústupků zákaznické zkušenosti a efektivitě?
Některé regulace, jako je například evropský Akt o umělé inteligenci, by mohly s podobnými požadavky v budoucnu přijít. Transparentnost bude u zákazníků vždy důležité téma, obzvláště v oborech s citlivými údaji, jako je bankovnictví nebo zdravotnictví. Budoucnost umělé inteligence v zákaznické péči tedy není pouze otázkou technologického vývoje, ale také etiky a regulací.
Budoucnost hlasové AI
Troufáme si předpovědět, že voiceboti v dohledné budoucnosti přestanou být pouze reaktivní a začnou být rovnou proaktivní. Budou lépe analyzovat sentiment hovoru, na základě kterého zvládnou předpovídat potřeby zákazníka. V kombinaci s historií zákazníka budou hovory ještě personalizovanější, než jsou nyní. Jednou z nejpalčivějších otázek do budoucna ale zůstává transparentnost – zákazníci nejspíš budou chtít vědět, že právě hovoří s robotem.
![]() |
Martin Čermák Autor článku je spoluzakladatel a CTO firmy Vocalls. |
![]() |
Martin Pacholet Spoluautor článku je AI project manager ve společnosti Vocalls. |