Hlasové vyhledávání je žhavé téma a raketově roste i jako byznys. Kde je největší potenciál technologie, komentuje Gejza Nagy.
Na bratislavském SEO Srazu v roce 2019 bylo vyhledávání hlasem žhavé téma. Thomas Kloos tehdy mluvil o tom, jak si lidstvo zrobotizovalo vlastní řeč. Klíčová slova při online nakupování zadáváme strnule a způsobem, který by v běžné řeči neobstál. Zatímco jsme tradiční textové vyhledávání vypiplali téměř k dokonalosti, za dveřmi je nová éra. Přivítejte vyhledávání hlasem, které se nám v Luigi’s Box podařilo zvládnout i díky strojovému učení a umělé inteligenci. Ať už jde o požadavky na vyhledání trasy při jízdě či přehrání muziky, voice search si mezi uživateli získal oblibu. Podle studie Dialogtech s ním produkty hledá přes 51 procent lidí. PWC.com uvádí, že 32 procent dává přednost hlasovému vyhledávání k nákupu před textem. Zatímco v roce 2017 globální obrat z hlasového vyhledávání činil asi dvě miliardy dolarů, predikce do roku 2022 očekávají až čtyřicet miliard.
„Siri, najdi mi…“
Potenciál vidím zejména u mobilů, kde je na stále větších displejích obtížnější psát jednou rukou. Navíc si zvykáme na ovládání pomocí hlasových asistentů jako Siri, Cortana, Google či Alexa. Primární cílovou skupinou je mladší generace — tento způsob jim umožňuje multitasking a šetří čas. Převod hlasu na text probíhá v milisekundách, systém ale musí i detekovat, kdy přestal uživatel mluvit. Proto může trvat jednotky sekund, než zařízení hlasový dotaz zpracuje. I to je však zanedbatelné vzhledem k tomu, kolik času denně trávíme při činnostech, kdy nemůžeme v ruce držet telefon. Tady hlasové vyhledávání exceluje a jeho potenciál vnímá stále více firem jak v e‑commerce, tak i enterprise sektoru.
Výsledky na povel
Technologie převodu hlasu na text existuje již roky, její využití ale bylo omezené. Díky AI a strojovému učení se značně posunula a Google dnes podporuje hlasové vyhledávání ve více než 100 jazycích. Při vyhledávání hlasem na webu si ale nevystačíte jen s dosavadním nastavením search enginu. Při mluvení se totiž vyjadřujeme komplexněji než při psaní. Zatímco se délka vyhledávané psané fráze u našich klientů pohybuje mezi dvěma až třemi slovy, u hlasu je obvyklých tři až pět slov. Pro technologii vyhledávání je stěžejní umět vyhodnotit víceslovné fráze, skládající se z kombinace povelu („najdi“), nepodstatných slov („mi“) a klíčového slova („fotbalový míč“). Umělá inteligence musí také zvládnout z historie vyčíst, jestli zákazník hledá produkt pro sebe či třeba pro někoho jiného, případně nabídnout výsledky podle jeho aktuální lokace.
Konkurenční výhoda
Víceslovné výrazy představují výzvu také pro SEO specialisty. S longtaily se totiž pracuje nejen při optimalizaci vyhledávání, ale i cílení kampaní v online marketingu. Obecnější výraz zvýší cenu reklamy. Konkrétnější nastavení, jako „červené bavlněné ponožky s puntíky“ naopak umožní velmi přesné cílení při nižších nákladech a lepší konverzní poměr. Naučit ale systém vyhodnotit hlasem zadaná data a spojit je s produkty je kvůli jejich množství výzva. Zejména pokud vaše nástroje používají e‑shopy napříč Evropou. Osvědčila se nám kombinace AI a strojového učení. Díky neustálému sběru a analýze dat se zlepšuje a dokáže si poradit s překlepy, slangem i cizími jazyky. V kombinaci s našeptávačem, doporučením produktů a návrhy na lepší řazení výsledků tak představuje konkurenční výhodu s velkým potenciálem.