text-to-speech

Text-To-Speech: Ľudsky znejúca reč pre zariadenia od Xiaomi

Xiaomi AI lab predstavili novinku Text-To-Speech, ktorá má ambíciu rozprávať prirodzeným ľudským hlasom, intonovať a vniesť do prednesu nálady. Pomôcka určená primárne pre ľudí s poruchou reči by nás mohla oslobodiť od strojovo rozprávajúcich zariadení.

zdroj: youtube.com/tagmediatv

Spoločnosť Xiaomi si dala za cieľ priniesť do našich životov viac komfortu pomocou inteligentných zariadení. To sa, samozrejme, týka aj ľudí s rôznymi postihnutiami a inými zdravotnými problémami. V rámci predvýskumu Own My Voice sa odborníci zo Xiaomi zamerali na ľudí s poruchou reči a snažili sa nájsť spôsob, ako im pomocou vylepšenia existujúcich technológií skvalitniť život.

Technológie už hovoria, no neosobne

Prirodzene, ľudia s poruchou reči túžia komunikovať hovoreným slovom a po vlastnom a originálnom hlase, možnosti intonovať a v rámci reči vyjadrovať emócie a nálady. Istým spôsobom dnes už hovoreným slovom komunikovať pomocou technológií môžu. Prenosné inteligentné zariadenia, notebooky a iné gadgety dokážu bežne prečítať písaný text.

Problém však je, že takýto spôsob komunikácie je maximálne neosobný. Aj keď môže pomôcť, ľudia ho neradi používajú. Dôvod je, že hlas umelej inteligencie znie strojovo, umelo, je neosobný, plochý a bez emócií a intonácie.  Prirodzene, takýto spôsob komunikácie nie je príjemný nikomu.

Text-To-Speech ma byť na nerozoznanie od ľudskej reči

Tento problém má vyriešiť novinka od Xiaomi AI Lab, Text-To-Speech. Tím vedcom, ktorí od roku 2017 publikoval 37 vysoko odborných príspevkov  na tému reči v tých najprestížnejších publikáciách, medzi ktorými nechýbal ani zborník z Medzinárodnej konferencie akustiky, reči a spracovaní signálu (ICASSP), pracuje na riešeni, vďaka ktorému by mali stroje rozprávať ako ľudia.

Neprehliadnite: Xiaomi sa podieľa na vývoji štandardov pre 5G

Tím nahral hlasy približne 200 dobrovoľníkov, z ktorých vysoko vyspelé algoritmy dokážu vygenerovať nové, originálne a prirodzene znejúce hlasy. Vzhľadom na personalizáciu a ochranu súkromia boli pôvodné hlasy upravené komplexnou akustickou úpravou, čo má byť tiež krok, ktorý pomôže s vytvorením unikátnych hlasov pre budúcich používateľov.

Práve prebieha dôležitá fáza testovania

Projekt je momentálne v tom štádiu, že umelá inteligencia na základe zozbieraných hlasov, skúseností a reakcií vybraných používateľov „trénuje,“ aby znela čo najprirodzenejšie, originálne, intonovala a dokázala v rámci rozhovoru vyjadrovať emócie, nálady, a aby mala reč správnu rytmiku.

Dá sa teda povedať, že Text-To-Speech od Xiaomi je aktuálne v tej najdôležitejšej a zároveň najkritickejšej fáze. Ak totiž projekt nenaplní ambície na 100 %, neponúkne, aspoň na teraz, nič nové. Hlasoví asistenti, Google Translator, Microsoft Word a mnohé ďalšie riešenia už dnes dokážu zaznamenať hlas, previesť ho na text a tiež napísaný text prečítať. Ak teda výsledok Text-To-Speech nebude 100 % presvedčivý, môže sa stratiť v konkurencií.

zdroj: youtube.com/tagmediatv

 Ak naplní očakávania, dokáže komunikáciu človek – stoj posunúť na novú úroveň. Nie len ľuďom s rečovou vadou ponúkne Xiaomi komfort, ktorý je aj dnes v dobe, kedy v technologickom svete už takmer nič nie je nemožné, je tak trochu sci-fi. Ostatne len si predstavte, že sa s hlasovým asistentom vo vašom smartfóne naozaj rozprávate ako s rovnocenným partnerom.

Novinky text-To-Speech sa dočkáme aj v smartfónoch

V Xiaomi sú pripravení novinku implementovať do všetkých svojich zariadení vybavených hlasovým asistentom. Teda smartfónov, tabletov a ďalších gadgetov.

Lídri spoločnosti Xiaomi poukazujú na to, že ak sa budeme zaujímať o potreby minoritných skupín, ako sú v tomto prípade ľudia s poruchou reči, tak nie len že pomôžeme im, ale prinesieme si pomocou technológii viac komfortu do životov my všetci.

Zaujímavé technológie vybavené hlasovým asistentom a ovládateľné hlasom od Xiaomi a spriatelených spoločností nájdete na overenom e-shope miStores.sk.