Chatbotovi moraju dobro poznavati jezik na kojem govore

Chatbotovi moraju dobro poznavati jezik na kojem govore
Dražen Tomić / Tomich Productions

Danas je uobičajeno ili bolje rečeno sve učestalije da umjesto razgovora sa stvarnim agentom pozivnog odnosno korisničkog centra neke tvrtke ili institucije s druge strane imate chatbot odnosno sustav automatiziranog odgovora na korisnički upit. Taj sustav uči, prepoznaje jezik, a što se krije iza svega pitali smo Nevenu Erak Camaj koja je zajedno sa svojim mužem tvorac jednog od rijetkih domaćih sustav za kreiranje chatbot rješenja Erato.

Chatbot koji se temelji na tehnologiji razumijevanja prirodnog jezika nudi dobre i široke temelje za spontanu, oprirođenu komunikaciju čovjeka i softvera, objašnjava za ICTbusiness.info Nevena Erak Camaj i dodaje da u stvaranju chatbota ponajprije je potrebno imati na umu kakvoj je publici namijenjen i kakvu svrhu treba ostvariti.

Korištenje NLP-a (Natural language processing), da se ne bi brkalo s još jednom NLP kraticom, danas postaje sve značajnije zahvaljujući strojnom učenju, naprednim algoritmima i računalnoj snazi. Sastavni je to dio chatbotova. Kako uopće nastaje chatbot?

NLP ili obrada prirodnog jezika grana je prirodne inteligencije koja se bavi analizom i razumijevanjem prirodnih, ljudskih jezika u svrhu interakcije s računalima koristeći prirodni jezik umjesto računalnih, umjetnih jezika. Drugim riječima, NLP računalu omogućuje da razumije ono što mu čovjek govori te da se ostvari smislena interakcija. Zahvaljujući NLP-u i različitim algoritmima i mehanizmima strojnog učenja, rečenice ljudskog jezika možemo strukturirati i preoblikovati na kojekakve načine - označavanjem, razlaganjem na manje smislene jedinice, određivanjem njihovih međusobnih odnosa, utvrđivanjem entiteta, sažimanjem, prepoznavanjem izvanjezičnih obilježja kao što su humor, agresivnost i dr.

U tom bi smislu NLP trebao biti u pozadini svakog chatbota, to jest softvera za komunikaciju s korisnikom, no nije uvijek tako. Postoje brojni primjeri strogo strukturiranih razgovornih robota koji nude usko definirane scenarije, a korisniku je na raspolaganju samo klikanje prethodno definiranih gumbića te nije moguć nikakav „otklon“ od scenarija jer softver za to nije osposobljen, što svakako dovodi u pitanje korist takvog proizvoda za krajnjeg korisnika.

Chatbot koji se temelji na tehnologiji razumijevanja prirodnog jezika nudi dobre i široke temelje za spontanu, oprirođenu komunikaciju čovjeka i softvera. U stvaranju chatbota ponajprije je potrebno imati na umu kakvoj je publici namijenjen i kakvu svrhu treba ostvariti. Duh komunikacije i persona chatbota zasigurno neće biti jednaki u chatbotu popularnog brenda namijenjenome dobnoj skupini od 25 do 35 godina te chatbotu koji služi razjašnjavanju knjigovodstvenih pitanja. Osim što treba imati na umu poboljšanje iskustva za krajnjeg korisnika, što je primarni cilj chatbota, za stvaranje dobroga razgovornog robota, s kvalitetno raspisanim dijalozima i pokrivenim temama, predviđenim potpitanjima korisnika, vrlo poželjnim i traženim elementima čavrljanja sa softverom potrebna je i dobra platforma za izradu chatbota, na kojoj se gradi struktura razgovornog softvera te upravlja životnim ciklusom chatbota nakon što ga jednom lansiramo u svijet. Smatramo da smo upravo takvo iskustvo uspjeli ponuditi korisnicima na našoj platformi erato.hr.

Što je sve potrebno pripremiti kako bi on prepoznavao pisani i govorni jezik?

Ovdje je riječ o dvije različite, ali komplementarne tehnologije. Tehnologija obrade prirodnog jezika razlikuje se od tehnologije pretvorbe glasa u tekst i teksta u glas, ali zajedno se stapaju u brojnim, danas već itekako prisutnim proizvodima na tržištu, ponajprije „kućnim pomoćnicima“ kao što su Google Home ili Amazonova Alexa. Tehnologijom pretvorbe glasa u tekst mi se ne bavimo jer postoje sjajna rješenja na tržištu koja već odlično rade i za hrvatski jezik (jedno od takvih rješenja razvijeno je i u Srbiji); naš posao kreće od trenutka kad postoji tekstualni zapis korisničkog inputa. Trenutačno se kod kuće igramo s izradom kućnog uređaja na hrvatskom jeziku, a naša pomoćnica odgovara na odličnome, tečnom hrvatskome.

Što se tiče samoga prepoznavanja jezika, sustav je vrlo slojevit i složen. Ukratko rečeno, razvili smo brojne opće i specijalizirane rječnike, detaljno algoritamski razložili gramatiku i frazeologiju hrvatskoga jezika, razvili brojne mehanizme strojnog učenja za poboljšanje i automatizaciju pojedinih dijelova sustava. Na razvoju i poboljšavanju sustava u Eratu se radi kontinuirano već šest godina. Osim što se neprestano mijenja, jezik je previše kompleksan sustav da bi se njegovo razumijevanje ikad moglo u cijelosti automatizirati. Često i u ljudskoj komunikaciji dolazi do nesporazuma - zbog iznimne važnosti konteksta, neverbalne komunikacije, između ostaloga - i nemoguće je od stroja očekivati da dosegne ljudsku razinu razumijevanja. Međutim, napori na svjetskoj razini stalno daju rezultate i svakim smo danom korak bliže tom idealu.

Koliko je komplicirano prepoznavanje hrvatskoga, odnosno slavenskih jezika koji su i znakovno ali i jezično dosta komplicirani te za razliku od engleskog nisu rasprostranjeni?

Hrvatski jezik i drugi slavenski jezici strukturno su svakako složeniji od engleskog jezika i za određene dijelove njegove obrade i razumijevanja potrebno je razviti prilagođene module. Tržišno gledano, velikim igračima poput Googlea nisu ni odveć zanimljivi u vidu razvoja dobrih, temeljitih rješenja jer je naša regija premalena za njihov interes, posebno uzimajući u obzir kompleksniju jezičnu materiju, no za engleski i veće svjetske jezike postoje sjajna rješenja na globalnoj razini. Što se domaćeg tržišta tiče, ono se u smislu razvoja rješenja za razumijevanje prirodnih južnoslavenskih jezika tek budi i mislim da u sljedećih nekoliko godina možemo očekivati brojne pomake u tom pogledu.

Na koji način iskoristiti znanje jezika u današnje moderno doba izgradnje chatbotova?

Jezik se svakako mijenja, mnogi bi rekli da se u današnje vrijeme i osiromašuje, posebno u komunikaciji mlađih generacija. Digitalizacija naše svakodnevice odrazila se i u načinima na koje komuniciramo, svi praktički živimo na messenger platformama. U tom kontekstu, chatbot se kao komunikacijski kanal nameće kao prirodno rješenje i modus za, primjerice, rješavanje problema u komunikaciji s pružateljima usluga umjesto klasične korisničke podrške telefonom ili mailom. Promatrajući chatbot kao posebnu jezičnu formu, jezik chatbota specifičan je jer mora biti aktualan, razumljiv i prihvatljiv među publikom s kojom komunicira, jednostavan a opet precizan i dovoljno širok da obuhvati sve pojavnosti korisničkog inputa.

Što je važnije da chatbot prepoznaje, književni ili govorni jezik? Na koji način to uskladiti?

Svaka dobra tehnologija za razumijevanje prirodnog jezika obuhvaća jezik u svim njegovim pojavnostima, pa tako i standard, dijalekte i razgovorni jezik. Hrvatski je idiomatski vrlo bogat i raznolik, što je bilo osobito izazovno pokriti u našoj tehnologiji, no u praksi se to svakako pokazalo kao nužno sudeći prema analizama načina na koji korisnici komuniciraju s našim chatbotima.