Un equip de científics dels EUA i Canadà ha desenvolupat un algoritme que captura la nostra capacitat d’aprenentatge i permet als ordinadors reconèixer i extreure conceptes visuals senzills tal com ho fan les persones. Els resultats de l’estudi es publiquen aquesta setmana a la revista Science.
Segons destaca Brenden Lake, autor principal i investigador de Moore-Sloan Data Science a la Universitat de Nova York, el treball “escurça el procés computacional d’aprenentatge de nous conceptes i amplia l’aplicació de les màquines a tasques més creatives”.
Quan els éssers humans afronten un nou concepte -per exemple, desxifrar com funciona un electrodomèstic, aprendre un nou pas de ball o una lletra d’un alfabet diferent- necessiten només uns pocs exemples per entendre el seu funcionament i reconèixer nous casos. En canvi, els ordinadors actuals necessiten centenars o milers d’instruccions per operar amb una precisió similar.
Programa bayesià d’aprenentatge
Per aproximar-se a la manera humana d’aprendre, els investigadors han desenvolupat un programa bayesià d’aprenentatge (BLP, per les sigles en anglès), en el qual els conceptes es representen com programes informàtics senzills.
Per exemple, la lletra ‘A’ està representada per un codi que genera exemples d’aquesta lletra quan s’executa. No obstant això, no es requereix un programador durant el procés d’aprenentatge, ja que l’algoritme es programa a si mateix construint codi per produir la lletra que veu.
També, a diferència dels programes estàndard d’ordinador que produeixen el mateix resultat cada vegada que s’executen, aquests programes probabilístics produeixen diferents sortides en cada execució. Això els permet copsar com varien les manifestacions d’un mateix concepte, per exemple, les diferents maneres en què dues persones dibuixen la lletra ‘A’.
Mentre que els algoritmes de reconeixement de patrons estàndard representen conceptes com configuracions de píxels o col·leccions de característiques, l’enfocament BPL aprèn ‘models generatius’ de processos reals, el que permet utilitzar les dades de manera més eficient.
Reconèixer nous exemples
El model també ‘aprèn a aprendre’. Per exemple, utilitza el coneixement de l’alfabet llatí per a aprendre les lletres de l’alfabet grec. Els autors van aplicar el seu model a més de 1.600 tipus de caràcters escrits a mà en 50 dels sistemes d’escriptura del món, i fins i tot van incloure lletres d’alfabets inventats com els de la sèrie de televisió Futurama.
A més de provar la capacitat de l’algoritme per reconèixer nous exemples d’un concepte, els investigadors van demanar tant als voluntaris com als ordinadors que reproduïssin una sèrie de caràcters escrits a mà després d’haver mostrat un sol exemple de cada un, o en alguns casos, per crear nous símbols.
Després, els científics van comparar els resultats dels participants i les màquines mitjançant test visuals de Turing. Als avaluadors humans se’ls van subministrar parells d’exemples tant dels participants com de màquines, juntament amb el símbol original, i se’ls va demanar identificar quin dels símbols havia estat produït per l’ordinador.
La intel·ligència d’un nen
“Abans d’entrar a la llar d’infants, els nens ja saben reconèixer nous conceptes a partir d’un sol exemple, i poden imaginar nous exemples que mai han vist”, assenyala Joshua Tenenbaum, professor de Brains, Minds and Machines del MIT i coautor de l’estudi .
Segons Tenenbaum, “encara estem lluny de construir màquines tan intel·ligents com un nen, però aquesta és la primera vegada que hem aconseguit que un ordinador sigui capaç d’aprendre i utilitzar un gran nombre de conceptes del món real, inclosos conceptes visuals simples com caràcters escrits a mà”.