Xiaomi koristi vlastito razvijenu govornu tehnologiju za pomoć osobama s poremećajima govora

Xiaomi koristi vlastito razvijenu govornu tehnologiju za pomoć osobama s poremećajima govora

Foto: DepositPhotos

Xiaomi je predstavio najnoviju primjenu naprednih algoritama i vlastite govorne tehnologije na području pristupačnosti. Tehnologija Text-To-Speech, koju je razvio Xiaomi AI Lab, koristi se za generiranje jedinstvenog i prilagođenog glasa za korisnike s poremećajima govora.

Korisnik sada može komunicirati s drugim ljudima koristeći "vlastiti glas", umjesto tipičnog monotonog elektroničkog glasa. Kao dio predistraživačkog projekta "Own My Voice" kojeg provodi Xiaomi Technical Committee, ovaj uspješan pokušaj demonstrira Xiaomijevu predanost filozofiji "Tech for Good" i ostvarivanju misije „da svi ljudi na svijetu uživaju u boljem životu putem inovativnih tehnologija".

Xiaomi brine o ljudima i kroz tehnološke inovacije nastoji zadovoljiti njihove različite potrebe. Otkrio je želju mnogih korisnika s govornim poremećajima za korištenjem vlastitog glasa za svakodnevnu komunikaciju, te osnovao projektni tim "Own My Voice" kako bi pozvao korisnike s govornim poremećajima kao primatelje glasa, tvrde u korproaciji.

"Uzbuđeni smo što ćemo istražiti višestruku vrijednost koju nam donose tehnološke inovacije, kao što je odgovor na zahtjeve korisnika za vlastitim identitetom i izgradnjom identiteta“, ističe Zhu Xi, voditelj tematskog tehnološkog odbora za Tech for Good u kompaniji Xiaomi Corporation.

Kako bi generirao najprikladniji, personalizirani glas za primatelja, projektni tim je angažirao više od 200 volontera unutar Xiaomia da doniraju svoje glasove. Koristili su algoritam za podudaranje otiska glasa kako bi uparili značajke glasova doniranih volontera s onima glasa primatelja. Ovim pristupom pronašli su najprikladniji glas kao osnovni zvuk glasovne reference za primatelja. S obzirom na personalizaciju i zaštitu privatnosti, odabranim stvarnim glasom manipulirano je složenim akustičnim modifikacijama kako bi se formirao novi i originalni zvuk glasa.

Zatim je upotrijebljena tehnologija Text-To-Speech spontanog stila za treniranje AI modela, čime je ovaj novi glas postupno dobio prirodan ritam i intonaciju koja može istinito izraziti emociju i ton čovjeka.

Projekt "Own My Voice" kombinira niz najnaprednijih algoritama s Xiaomijevom samorazvijenom govornom tehnologijom kako bi se osigurala specifičnost, sigurnost i visoka autentičnost sintetiziranog glasa, stvarajući novu ideju o prilagođenoj sintezi govora za korisnike s govornim poremećajima.

Okosnica ovog projekta je grupa stručnjaka za govornu tehnologiju iz Xiaomi AI Laba. Od 2017. godine objavili su 37 radova o govoru u zbornicima vrhunskih međunarodnih konferencija, poput Međunarodne konferencije o akustici, govoru i obradi signala (ICASSP). Uspjeh "Own My Voice" uglavnom ovisi o Text-To-Speech tehnologiji spontanog stila koju su razvili.

Tehnologija Text-To-Speech spontanog stila u biti čini da sintetizirani glas zvuči poput ljudskog u svojoj intonaciji, pauzi, brzini i drugim značajkama. Time se monoton i neprirodan osjećaj elektroničkog glasa zamjenjuje prirodnijim. Trenutno se ova tehnologija primjenjuje na mnoge pametne uređaje koji koriste Xiaoai, AI glasovnog asistenta kompanije Xiaomi. Projekt "Own My Voice" pokazuje da Text-To-Speech tehnologija spontanog stila također može biti široko prihvaćena u područjima pristupačnosti i poboljšati korisničko iskustvo.

„Ako primijetimo potrebe manjinskih skupina u ranoj fazi i odgovorimo na njih, proces širenja tehnologije mogao bi se uvelike skratiti. To omogućuje da prednosti novih tehnologija postanu trenutno dostupne korisnicima s posebnim potrebama“, dodaje Xi.

Idući naprijed, Xiaomi će nastaviti primati povratne informacije od primatelja glasa i dalje proučavati izvedivost ovog projekta u širem rasponu. Xiaomi će nastaviti osnaživati pristupačnost kroz vrhunsku tehnologiju, nastojeći ispuniti različite potrebe ljudi kroz tehnološke inovacije, zaključuju iz ove kompanije.

Još iz kategorije

Aircash u New Yorku kao vodeća hrvatska FinTech inovacija

Aircash u New Yorku kao vodeća hrvatska FinTech inovacija

27.06.2022.

Udruga hrvatsko-američkih profesionalaca (ACAP) nedavno je u New Yorku organizirala hrvatsku konferenciju 'Croatian Tech Superstars Competing on a Global Market'.  Uspješne tehnološke tvrtke na konferenciji su predstavili su brojni hrvatski poduzetnici i vlasnici uspješnih startup kompanija, među njima i Hrvoje Ćosić, CEO tvrtke Aircash.

Interes za Algebru 40 posto veći nego lani, 160 studenata želi i britansku diplomu

Interes za Algebru 40 posto veći nego lani, 160 studenata želi i britansku diplomu

27.06.2022.

Algebra nastavlja podizati standarde u području visokog obrazovanja što je, prema podacima objavljenim na portalu Postani student, rezultiralo rastom prijava za studijske programe ukupno za čak 40 posto u odnosu na lani, odnosno za 27 posto kad je riječ o prva tri izbora. Prema aktualnom broju prijava, Algebra najveći rast interesa bilježi za studij dizajna, za koji se prijavilo čak dvostruko više maturanata nego lani. Interes za studij digitalnog marketinga porastao je za 40 posto, dok studij računarstva bilježi 35 posto više prijava.

Poticaji za električna vozila podijeljeni u samo 50 minuta

Poticaji za električna vozila podijeljeni u samo 50 minuta

27.06.2022.

Fond za zaštitu okoliša i energetsku učinkovitost jutros je u 8 sati otvorio natječaj za subvencioniranje kupovine energetski učinkovitih vozila. Tako se pri kupovini vozila s potpuno električnim pogonom ili pogonom na vodik moglo ostvariti do 70 tisuća kuna subvencije, a za L1-L7 vozila (električni skuteri, mopedi, motocikli i sl.) se moglo dobiti do 20 tisuća kuna.