Jedan kibernetički pogled na racionalizam i empirizam u dobu strojnog učenja i Covida

Jedan kibernetički pogled na racionalizam i empirizam u dobu strojnog učenja i Covida

Prije svega trebam se ispričati čitatelju na kibernetičkom pristupu-premda mnogi taj pojam koriste neformalno, meni je to vrlo prirodna ontologija, tako da sam metodološki vrlo ponosan misaoni nasljednik sovjetske kibernetike, posebno Alekseja Ljapunova.

Na cijelu situaciju uzrokovanu Covidom možemo gledati iz dva aspekta, prvi je zdravstveni, a drugi je ekonomski. U zdravstvenom pogledu, prioritet se stavlja na zaštitu života ljudi, a kao protuteža se nazire potreba za nesmetanom ekonomskom aktivnošću. Gotovo smo jedinstveni u shvaćanju da treba slušati stručnjake. No možda da postavimo jedno pitanje kao uvod u naše razmišljanje: je li veći stručnjak za pandemiju (a) tek specijalizirani epidemiolog koji ima duboka znanja o mikrobiološkim mehanizmima, ili (b) sociolog s Oxforda koji 40 godina proučava interakciju širenja bolesti i njihove utjecaje na razna društva.

Premda ovo pitanje zvuči iskarikirano, iza njega se krije jedna dvojba koja je čovječanstvo muči (u nekom obliku) već 2500 godina. Premda je ovo pitanje često marginalizirano kao čisto akademski problem filozofije, kao i svi veliki problemi filozofije najviše do izražaja dolazi kada se čovječanstvo susreće s kompleksnim i velikim izazovima. Kada se radi o nikad viđenim kompleksnim fenomenima, s pravom se može postaviti pitanje jesu li dosadašnje prakse dobre, ili opasne. Dakle, kada se sve uzme u obzir-- je li bolje slijediti iskustvo ili intuiciju? Naravno da je brzi kompromisni odgovor “oboje“ besmislen, jer će u svakoj konkretnoj odluci sudjelovati obje kognitivne komponente, ali konačnu prevagu (i odluku) će donijeti samo jedna--i svatko od nas, za svaku odluku će biti u stanju točno reći je li ona donesena temeljem iskustva ili intuicije, temeljem konkretnog ili apstraktnog, prošlog ili budućeg.

Možda malo preciznije: trebamo li kod važnih odluka slijediti induktivno zaključivanje iz (dosadašnjeg) iskustva ili deduktivno zaključivanje iz (nekih) aksioma? Ne bi bilo krivo ustanoviti da obje metode imaju svoje limitacije: iskustvo daje vrlo konkretna rješenja za probleme koji su se točno u tom obliku već javili. No zašto ne bismo mogli reći “u sličnom obliku“? Naravno, čim ekspliciramo ovo pitanje, jasno je da “slično“ nije dovoljno dobro kada se radi o primjeni dosadašnjih iskustva na dosad neviđene fenomene--na fenomene koji su po svojoj prirodi “različiti“ od svega viđenog. Znači li to da kada imamo nove stvari trebamo koristiti deduktivno zaključivanje a ne induktivno? Descartesovu “intuiciju“ odnosno uvid? Čitatelj koji je imao priliku pogledati miniseriju Černobil vjerojatno može iz te priče utemeljene na istinitim događajima razlučiti koliko je proces zaključivanja kompleksan kada ga trebamo koristiti u scenarijima koji se do tog trenutka nisu dogodili.

U današnjem svijetu ne postoji ništa ljepše za čuti nego kada netko zaziva strojno učenje--uvažavajući Maslowljev čekić možemo reći da su pojmovi poput “slično“ kao stvoreni za strojno učenje. No pritom je uhu koje pozna ove tehnike jezivo razlučiti apokaliptične, inkompetentne i prezanesene alikvote koje generira lakoća kojom se strojno učenje određuje kao rješenje za sve probleme, sadašnje i buduće--jedini razlog zašto Moreova Utopija nije realizirana je zato što nisu imali strojno učenje.

Da biste vidjeli problem u svojoj punini, razmislite o sljedećem. Biste li htjeli da na primjer sustav strojnog učenja odlučuje je li treba ugasiti reaktor u nuklearnoj elektrani Krško? Nikako ne bih htio da se ovdje iščitava neki neoludizam--draga mi je tehnologija, i drago mi je strojno učenje. Ali svaka metoda ima svoje limitacije, pri čemu su ovdje limitacije matematičke prirode. Ako želim napraviti sustav strojnog učenja koji će mi reći kada treba ugasiti jezgru, prije svega treba uočiti da ćemo mi imati puno više uzoraka koji kažu “sve je u redu“ od onih koji kažu “opasnost“. Intuitivno, ako mi imamo jednu “opasnost“ na 100 uzoraka, i sustavu kažemo da je ok da fula u jednom slučaju od dvadeset, mi smo garantirali da će on biti neupotrebljiv--jednostavno će uvijek reći “sve je u redu“, i statistički biti u pravu više nego što od njega tražimo. Pritom treba imati na umu da je ovo matematičko-formalna limitacija bilo kojeg sustava strojnog učenja. Deduktivni sustavi bi bili puno bolji, ali njih je vrlo teško dizajnirati a još teže dorađivati. Ako uzmemo umjetne neuralne mreže, to znači da one neće moći naći adekvatne pondere da naprave željenu separaciju klasa.

No postoji još jedna mogućnost: možemo prihvatiti da su neki procesi po prirodi stvari takvi da se strojno učenje na njih ne može primijeniti, no što je s ostalim procesima? Neki procesi su takvi da jednostavno možemo skupiti još podataka--ili očistiti postojeće podatke. Ako sustav strojnog učenja ima više podataka, lakše će naučiti kako separirati klase “DA“ i “NE“. Ako pak ima čišće podatke, na manjem broju podataka će lakše uspjeti odlučiti što je bitno za “DA“ a što za “NE“.

U ovom zadnjem leži jako puno mogućnosti: što znači očistiti podatke? Naravno, prva razina čišćenja je odstranjivanje očitih besmislica, npr. kad negdje nađemo na neka osoba ima pod “Ime oca“ zapisano “Ulica Grada Vukovara 1“. Posebno interesantno postaje kada počinjemo razmišljati što je to podatak a što informacija. Uzmimo sljedeći primjer. Ako pitam “Hoće li sutra u Zagrebu u 11:00 biti više od 1mm/m2 padalina?“, odgovor može biti (1) “Da“, (2) “Da padat će kiša“ ili (3) “Da, bit će 1,2 mm/m2 padalina“. Intuitivno osjećamo da je prvi odgovor isti kao drugi samo kraći, što znači da ima više informacija “po slovu“. No što je s trećim odgovorom? Je li on informativniji od prvog? Zanimljivo je vidjeti da u općem smislu je, no u smislu postavljenog pitanja je po informativnosti još gori od (2)--daje najmanje informacija po slovu. Zašto? Jer je postavljeno pitanje bilo DA/NE, specifičnosti nisu bile važne, dakle sve ostalo su samo nepotrebno napisana slova.

No tu smo došli do jednog vrlo zanimljivog uvida. Premda je (3) loš po efikasnosti dostave informacije s obzirom na ovo konkretno pitanje, takvi odgovori bi bili najkorisniji tip odgovora za skupljanje trenutno nebitnih informacija koje će u nekom budućem trenutku možda biti korisne. Ovo nas vodi do razmišljanja o “informacijskom investiranju“, jer je pohrana podataka koji će možda dati “informacijsku prednost“ u budućnosti skupa--u svakom slučaju skuplja nego da isključivo servisiramo trenutne informacijske potrebe.