DeepMind AI a devenit un jucător de șah supraomunic în câteva ore, doar pentru distracție

Jocul final pentru filiala Google AI DeepMind nu a bătut niciodată oamenii la jocuri de bord. Întotdeauna a fost vorba de a crea ceva asemănător unui motor cu combustie pentru inteligență – o mașină generică de gândire care poate fi aplicată într-o gamă largă de provocări. Compania este încă departe de a atinge acest obiectiv, însă noile cercetări publicate de oamenii de știință din această săptămână sugerează că aceștia se îndreaptă cel puțin pe calea cea bună.
În hârtie , DeepMind descrie modul în care un descendent al programului AI care a cucerit prima dată jocul board Go a învățat să joace un număr de alte jocuri la un nivel suprauman. După opt ore de auto-redare, programul a bătut AI care a bătut prima dată lumea umană Go campion ; și după patru ore de antrenament, a bătut actualul campion mondial la programul de șah, Stockfish. Apoi, pentru o tură de victorie, sa antrenat doar două ore și a lustruit unul dintre cele mai bune din lume shogi -programe de joc numite Elmo ( shogi fiind o versiune japoneză a șahului care se joacă pe o placă mai mare).
Pentru fiecare joc, programul AI sa învățat cum să joace
Unul dintre avantajele cheie este că noul program AI, numit AlphaZero, nu a fost conceput special pentru a juca vreunul dintre aceste jocuri. În fiecare caz, au fost date câteva reguli de bază (cum ar fi modul în care cavalerii se mișcă în șah și așa mai departe), dar a fost programat fără alte strategii sau tactici. Pur și simplu sa îmbunătățit, jucându-se mereu și repede într-un ritm accelerat – o metodă de formare a AI, cunoscută sub numele de “învățare prin întărire”.
Folosirea învățării prin întărire în acest mod nu este nouă în sine. Inginerii DeepMind au folosit aceeași metodă pentru a crea AlphaGo Zero; programul AI care a fost prezentat în octombrie . Dar, după cum descrie lucrarea din această săptămână, noul AlphaZero este o “versiune mai generică” a aceluiași program, ceea ce înseamnă că poate fi aplicat într-o gamă mai largă de sarcini fără a fi pregătit în prealabil.
Ceea ce este remarcabil aici este că, în mai puțin de 24 de ore, același program de calculator a fost capabil să se învețe cum să joace trei jocuri complexe de bord la niveluri superumane. Asta este un nou succes pentru lumea AI.
Acest lucru ia DeepMind doar puțin mai aproape de construirea mașinii de gândire generice pe care compania o visează, dar provocările majore stau în față. Atunci când CEO-ul DeepMind, Demis Hassabis, a prezentat AlphaGo Zero la începutul acestui an, el a sugerat că o versiune viitoare a programului ar putea ajuta cu o serie de probleme științifice – de la proiectarea de noi medicamente la descoperirea de noi materiale. Dar aceste probleme sunt calitative foarte diferit doar să joci jocuri de masă și trebuie să faci o mulțime de lucruri pentru a afla cum le pot rezolva exact algoritmii. Tot ce putem spune cu certitudine acum, este că inteligența artificială sa transformat cu siguranță în joc de șah.

Comments are closed