Ondřej Tůma: V zákulisí vývoje hlasového asistenta – od nápadu k reálnému řešení

Saša: Často si ani neuvědomujeme, že naše aplikace používají tisíce lidí 

13. 08. 2025

7 minut

Ondřej Tůma pracuje v České spořitelně jako product designer ve Voicebot týmu, kde pomáhá vytvářet hlasové asistenty zjednodušující komunikaci mezi klienty a pobočkami. V rozhovoru s ním jsme si povídali si o tom, jak takové AI řešení vzniká, jaké výzvy přináší a jak technologie hlasových asistentů mění přístup k zákaznickému servisu v bance. Prozradí, jak se navrhují systémy, které nejen šetří čas bankéřům, ale zároveň klientům usnadňují život.

Ondro, pracuješ jako product designer ve Voicebot týmu České spořitelny. Můžeš popsat, co tato role obnáší?

Jako product designer ve Voicebot týmu se podílím na navrhování AI řešení, která zlepšují komunikaci mezi klienty a pobočkami. Nejde ale o individuální práci, úspěch závisí na spolupráci celého týmu. Pracuji s vývojáři, analytiky, konverzačními specialisty, datovými analytiky i testery. Každý z nás přináší jinou perspektivu a bez propojení těchto pohledů bych se jako designer nikam neposunul. Moje role začíná u výzkumu a mapování potřeb, pokračuje návrhem a končí testováním a nasazením. Zastupuji hlas uživatele, ať už je to klient nebo bankéř, ale zároveň musím chápat technické i byznysové limity. Výzvou je najít rovnováhu mezi zájmy klienta, bankéře a celé organizace a převést je do funkčního a srozumitelného řešení. To všechno ve spolupráci s týmem. 

Jak ses k práci na hlasových asistentech vlastně dostal? Byla to tvoje cílená volba, nebo spíš souhra okolností?

Nebyla to náhoda – už jako bankéř v ERSTE Premier jsem věděl, že se chci časem posunout k digitálnímu vývoji. Zapojil jsem se do Digi a Investiční garantské skupiny, díky čemuž jsem lépe pochopil fungování banky i potřeby klientů z pobočky. Pak jsem nastoupil do rozvojového programu Satori, kde mě mentoroval Lukáš Pudil. Pomohl mi získat širší vhled do fungování banky a na konci mě propojil s Michalem Krausem z domény Customer Facing AI. Pozval jsem Michala na kávu, zajímala mě oblast AI, které jsem se věnoval i ve volném čase. Slovo dalo slovo a brzy na to jsem nastoupil do Voicebot týmu jako product designer.

NLP modely

Zkratka pro "natural language processing", neboli zpracování přirozeného jazyka. Umožňují počítačům rozumět lidské řeči, a třeba díky nim Voicebot pozná, co klient říká, a správně na to zareaguje.

LLM modely

Zkratka pro "large language models" – velké jazykové modely, jako je třeba ChatGPT. Učí se z obrovského množství textů a dokážou vést přirozený, plynulý dialog, který zní jako od člověka.

Co si můžeme představit pod pojmem "hlasový asistent" v bankovním prostředí? V jakých situacích dnes klienti nebo bankéři s voicebotem přicházejí do kontaktu?

Hlasový asistent v bance je AI systém, který pomáhá odbavovat telefonáty nejen směrem ke klientům, ale i uvnitř banky. Dnes ho využíváme ve čtyřech hlavních oblastech: interní IT helpdesk, kde třídí příchozí hovory, kontaktní centrum, kde odbaví až 30 % klientských hovorů, eRecepce nasazenou na všech pobočkách, kde přijímá hovory, řeší běžné požadavky a přepojuje na bankéře a asistent pro bankéře, který je aktuálně v pilotu. Ten zvedá hovory, když je bankéř na schůzce, a sjednává zpětná volání nebo schůzky.

Technicky fungujeme na bázi NLP modelů, kde navrhujeme konverzační stromy – předem připravené scénáře. Nově ale zapojujeme i LLM modely (např. ChatGPT od OpenAI), které umí jednat přirozeněji a flexibilněji. Pomáhají třeba s domlouváním schůzek a do budoucna je chceme plně integrovat. Celkově máme přes 90 scénářů, od blokace karty po sjednání návštěvy. Klientům to zjednodušuje obsluhu, bance zase šetří čas a kapacity.  

Jaké problémy se pomocí AI a voicebotů ve Spořce snažíte řešit?

Největší problém, který pomocí AI a hlasových asistentů řešíme, je nízká dovolatelnost na pobočky. Bankéři mají během dne omezenou kapacitu, jelikož se věnují klientům osobně, a tak nestíhají zvedat všechny příchozí hovory. Ročně přijde na pobočky přes 4,6 milionu hovorů, ale bankéři zvládnou odbavit jen 1,9 milionu. Znamená to, že se dovolají jen 4 z 10 klientů a zbytek zůstává bez obsloužení, často právě proto, že je bankéř na schůzce. Tady přichází na řadu voicebot. Zvedne hovor, vyslechne požadavek, pomůže s běžnými věcmi nebo domluví zpětné volání. Klient tak není "odmítnutý", pobočky se odlehčí a péče o klienta zůstává zachovaná.

„Klientům to zjednodušuje obsluhu, bance zase šetří čas a kapacity.“

Jak vypadá tvoje práce od začátku projektu až po nasazení do ostrého provozu? Co všechno jako product designer řešíš? 

Jako product designer mám zodpovědnost za to, aby řešení dávalo smysl pro uživatele, byznys i technicky. Design není jen o tom, jak věci vypadají, ale hlavně jak fungují a jestli je lidé chtějí používat. A to nikdy nedělám sám. Na začátku je vždy problém jako třeba přetížení bankéřů nebo vysoký počet nedovolaných klientů. Mluvíme s lidmi, analyzujeme data a snažíme se porozumět situaci. Pak navrhujeme první koncepty, které testujeme s uživateli. Cílem je vytvořit řešení, které bude mít reálnou hodnotu, ne jen další „funkci do šuplíku“. Následně si řešení rozdělíme do menších částí a začínáme s vývojem. Já celou dobu hlídám, aby vše drželo pohromadě z pohledu uživatele, a to od integrace přes testování dialogů až po trénování modelů. Před nasazením připravíme pilot, materiály pro pobočky a proces pro sběr zpětné vazby. Během pilotu měříme, posloucháme a upravujeme. Až když víme, že to opravdu funguje, jdeme do celé sítě. Ani potom ale práce nekončí – sledujeme výkon, upravujeme scénáře a dál vylepšujeme voicebota i celý zážitek.

Jedním z projektů, na kterých pracuješ, je takzvaná eRecepce. Můžeš přiblížit, o co jde?

eRecepce je projekt, ve kterém přenášíme voicebota z kontaktního centra na pobočky. Funguje jako digitální recepční. Když klient volá na konkrétní pobočku, voicebot mu pomůže hned – odpoví na dotaz nebo rovnou domluví schůzku, aniž by musel čekat na bankéře. Vycházíme z osvědčených scénářů z kontaktního centra, ale musíme je přizpůsobit novému prostředí. Řešíme třeba propojení s kalendáři bankéřů, technické nastavení, komunikační styl i plynulé začlenění do provozu pobočky. Cílem je rychlejší a dostupnější obsluha pro klienta a úleva pro pobočky.

Prvenství na trhu

Spořitelna je první bankou v ČR, která integrovala technologii OpenAI do hlasového asistenta. Díky nové funkci schůzkovník si mohou klienti dynamicky sjednat schůzku přímo během hovoru – bez čekání, kdykoli a odkudkoli.

Co vás při vývoji nebo provozu eRecepce překvapilo, ať už pozitivně nebo negativně?

Překvapila nás komplexita reality pobočkové sítě. Na první pohled to vypadá jednoduše, ale každá pobočka funguje trochu jinak – liší se otevírací dobou, vybavením, přestávkami, bezbariérovostí nebo třeba přítomností schránek. To byla velká výzva při navrhování odpovědí na běžné otázky typu „Kdy máte otevřeno?“ nebo „Je pobočka bezbariérová?“, protože správná odpověď se liší pobočku od pobočky. V tomhle udělal obrovský kus práce náš kolega Miroslav Kunčar, konverzační specialista se zájmem o LLM a architekturu hlasových řešení. Díky jeho přístupu dnes voicebot odpovídá správně podle konkrétní pobočky, stačí si zavolat a vyzkoušet.

„Je to ambiciózní cíl, ale právě proto do něj jdeme.“

Máte k dispozici i nějaké výsledky? Jaký vliv eRecepce měla na dostupnost poboček nebo spokojenost klientů?

Ano, a jsou to výsledky, které nám dělají velkou radost. Od nasazení eRecepce do celé sítě 17. dubna 2025 voicebot každý měsíc zvedne v průměru 35 000 hovorů, z toho 40 % zvládne vyřešit úplně sám bez zásahu člověka. Tím šetříme čas bankéřům, kteří se můžou víc věnovat klientům osobně, tam kde je to nejvíc potřeba. Změnu vidíme i na datech. V květnu 2024, před eRecepcí, zazvonil telefon na pobočkách 32 000× a dovolalo se jen 5 z 10 klientů. Na rozdíl od toho v květnu 2025 to bylo jen 15 000 hovorů a dovolalo se 7 z 10. Díky tomu jsme výrazně zlepšili dostupnost poboček. Klienti se snáz dovolají, bankéři nejsou přetížení a tím roste spokojenost na obou stranách.

Pracuješ i na dalším zajímavém řešení, kterým je virtuální asistent zastupující bankéře, když nemohou přijmout hovor. Jak to celé funguje?

Když je bankéř zaneprázdněný, po cca 15 vteřinách hovor převezme hlasový asistent. Není to jen automat, ale skutečný pomocník, který klientovi vysvětlí situaci a nabídne domluvení zpětného hovoru nebo schůzky. Pokud klient nic nechce, pošle mu SMS s číslem na Kontaktní centrum. Vytvořit plynulý scénář nebylo jednoduché. Museli jsme zajistit rychlé přepnutí hovoru, empatickou komunikaci a přirozený dialog, který klienta nezatíží složitými volbami. Cílem bylo, aby asistent působil lidsky, byl spolehlivý a konzistentní. Nyní pracujeme na tom, aby asistent zvládal i aktivní operace a FAQ z eRecepce, a stal se tak plnohodnotným hlasovým pomocníkem. Technologicky využíváme kombinaci NLP a LLM, což umožňuje přirozený a chytrý dialog. Na řešení pracujeme v tandemu s kolegou Miroslavem Kunčarem. Kombinujeme byznysový, technický a konverzační pohled. Díky téhle kombinaci tvoříme sehraný tým, a asistent nepůsobí jako robot, ale jako někdo, komu s klidem svěříte domlouvání schůzek.

Zajímá vás práce v IT? 

Jaký byl cíl tohoto řešení a co na něj říkají bankéři, kteří ho testovali?

Cílem tohoto řešení je zlepšení dovolatelnosti našich bankéřů ideálně tak, aby se každý klient vždy dovolal a počet nepřijatých hovorů se blížil nule. Je to ambiciózní cíl, ale právě proto do něj jdeme. Pilot stále běží a sbíráme zpětnou vazbu, ale první reakce kolegů v pobočkové síti jsou velmi pozitivní. Řešení jim dává smysl, jelikož místo zmeškaných hovorů mají v kalendářích rovnou naplánované schůzky a hovory s klienty, což jim výrazně pomáhá v organizaci práce.

Co všechno vlastně musíte promyslet a připravit, než takový produkt pustíte do celé sítě poboček?

Spuštění do celé sítě teprve připravujeme a ladíme. Klíčové je pochopit rozdíly mezi pozicemi v síti a navrhnout asistenta tak, aby dával smysl pro každou z nich. Běžný bankéř pracuje s konkrétní skupinou klientů na jedné pobočce, zatímco specialista (například na investice či pojištění) se pohybuje mezi více pobočkami a má odlišný režim práce. Musíme tedy navrhnout, jak asistent bude fungovat v různých kontextech: co nabídne, jak se bude chovat a kdy koho informovat. Jde nejen o technologii, ale hlavně o to, aby řešení dobře zapadlo do každodenní práce lidí v síti a skutečně jim pomáhalo.

„Balancovat častokrát protichůdné požadavky a udržet celkový směr projektu je pro mě stále největší výzvou, ale zároveň i nejzajímavější část práce.“

Co je pro tebe jako designéra při tvé práci největší výzva?

Největší výzvou je pro mě najít skutečnou rovnováhu mezi potřebami uživatelů, byznysem a technologickými omezeními. Musím neustále poslouchat hlas zákazníka a zároveň rozumět tomu, co je technicky možné a co má smysl z byznysového hlediska. Často to znamená dělat kompromisy, ale zároveň usilovat o to, aby výsledné řešení bylo uživatelsky přívětivé, funkční a měřitelné z hlediska přínosu. Zároveň cítím odpovědnost za to, že návrh, který předložím, skutečně přinese hodnotu a bude správně přijatý ve firmě i mezi klienty. Balancovat tyhle protichůdné požadavky a udržet celkový směr projektu je pro mě stále největší výzvou, ale zároveň i nejzajímavější část práce.

Mrkněte také na další příběhy zaměstnanců Spořky