Programska oprema se je »učila« z igrami sama proti sebi. Foto: Pixabay
Programska oprema se je »učila« z igrami sama proti sebi. Foto: Pixabay

Googlova raziskovalna skupina Google DeepMind je naredila velik korak v razvoju umetne inteligence. Nova programska oprema, poimenovana AlphaGo Zero, se ni le sama naučila igrati starodavne kitajske družabne igre go, temveč je celo razvila svoje nove poteze in strategije. In to v samo treh dneh.

Programska oprema je po poročanju BBC-ja na začetku poznala zgolj pravila igre in nato tri dni proučevala partije človeških nasprotnikov. Sledil je dvoboj s predhodnico AlphaGo. Premagala jo je kar s 100 : 0. AlphaGo je sicer zaslovela, potem ko je premagala dva najboljša igralca go-ja na svetu, Južnega Korejca Lija Sedola in Kitajca Ke Džija.

Kot pri številnih dosežkih na tem področju je ta zahteval kombinacijo velikih količin podatkov, v tem primeru zapiske tisočih iger in veliko računalniško-procesne moči.

"Zelo smo navdušeni, saj menimo, da smo zdaj dovolj uspešni, da lahko dosežemo nekaj resničnega napredka pri nekaterih resničnih težavah, čeprav smo očitno daleč od popolne umetne inteligence," je povedal glavni izvršni direktor družbe DeepMind Demis Hassabis, ki se je pred tem ukvarjal z razvojem videoiger.

Raziskovalec Google DeepMind-a David Silver, ki je vodil projekt, pravi, da so se pri AlphaGo Zero odločili za popolnoma drugačen pristop. "Nova različica se začne z nevronsko mrežo, ki ničesar ne ve o igri go. Edino znanje, ki ga ima, so pravila igre," je pojasnil. Programska oprema se je "učila" z igrami sama proti sebi. To se je izkazalo za veliko učinkovitejši način reševanja problema.

Medtem ko je AlphaGo potreboval nekaj mesecev, da je prišel do točke, ko se je lahko pomeril s profesionalci, je AlphaGo Zero do te stopnje prišel v samo tri dneh, pri tem pa je uporabljal le del procesorske moči. "To kaže, da so novi algoritmi, tisti, ki štejejo, ne računska moč ali podatki," pravi Silver, ki je navdušen nad tem, da so stroji v zgolj nekaj dneh sposobni preseči znanje o igri, ki ga je človeštvo pridobivalo skozi tisočletja. "Odstranili smo vse omejitve, ki jih ima človeško znanje, in zato smo lahko ustvarili znanje iz tako rekoč praznega lista."

Medtem ko so se starejše različice hitro naučile in izboljšale človeške strategije, je AlphaGo Zero razvil tehnike, ki jih profesionalni igralec, ki je pri projektu sodeloval kot svetovalec, še nikoli ni videl.

Nove možnosti uporabe tudi v medicini
Številne ekipe so se zdaj posvetile novim projektom, kjer skušajo ta tehnike uporabiti na novih področjih. Demis Hassabis kot zanimiva področja omenja načrtovanje zdravil in odkrivanje novih materialov.

"Upam, da bodo tovrstni algoritmi lahko vseskozi sodelovali z nami kot znanstvenimi strokovnjaki, strokovnjaki za napredek na področju znanosti in medicine. To si želim," je dejal.

Toda skupaj s kolegi je previden glede tega, kako hitro bomo lahko priča širši uporabi umetne inteligence. Igra, kjer so pravila jasna, je ena stvar. Kaotičen, naključen in nepredvidljiv resnični svet pa je nekaj povsem drugega.