fbpx

MENÚ: INICIO — MAPA — CONTACTO

Aunque es temprano para decretarlo, AlphaZero es uno de los más brillantes inventos en el camino de las máquinas que autoaprenden. Puede ser el estándar para una nueva generación robótica.

Javier Brassesco

(Diciembre 14, 2018). Muchos creen que estamos viviendo una época que marcará el destino de la historia de la humanidad, a la altura de la toma de Constantinopla por los turcos o el descubrimiento de América. ¿La causa? Una red neuronal de inteligencia artificial que muchos ni siquiera han oído nombrar y que por estos días cumple un año de haber sido lanzada: AlphaZero.

Se trata de un producto verdaderamente revolucionario de DeepMind, la división de Google para el estudio y desarrollo de la inteligencia artificial, y que desde hace meses tiene de cabeza a los expertos en esta materia.

Poca información se consigue sobre AlphaZero más allá del mundo del ajedrez (la semana pasada se hizo público un nuevo match a mil partidas en donde AlphaZero aplasta al mejor programa de ajedrez que existe, Stockfish), pero algo semejante pasó con los primeros vuelos de los hermanos Wright y que serían la raíz de la aviación moderna: el mundo estaba más atento al desarrollo de los dirigibles, que volaban más alto y se desplazaban más lejos, y pocos dirigían su mirada a los aparatosos vuelos de estos hermanos, que solían estrellarse tras recorrer 50 metros.

Buena para todo

El objetivo de DeepMind es crear una máquina que sea capaz de enfrentarse a cualquier situación sin ayuda externa, y AlphaZero fue su primer producto verdaderamente acabado en este sentido.

Primero lo intentaron enseñándole solo las reglas de los tres juegos de tablero más difíciles que existen: el go, el shogi y el ajedrez. Con un algoritmo de autoaprendizaje, conociendo solo las reglas de estos tres juegos y tras pocas horas jugando contra sí misma, esta red neuronal se hizo prácticamente invencible, como se explica en un reciente artículo de la revista Science.

Se trata de una máquina que no tiene el gran poder de cálculo de otras, pero esa carencia la sustituye con algo muy difícil de inculcar a un ser inanimado: intuición.

En ajedrez, por ejemplo, calcula “solo” 60 mil posiciones por segundo, lo cual puede sonar a mucho para alguien neófito en estos temas. Stockfish, el mejor programa de ajedrez que existe en el momento, calcula 60 millones por segundo (mil veces más que AlphaZero), y sin embargo apenas le pudo ganar seis de mil juegos, perdiendo 155 y empatando el resto, en un match disputado en enero de este año (aunque fue la semana pasada que se hizo público el resultado de este encuentro).

Lo curioso es que la máquina aprende por sí misma, solo se le enseñan las reglas y ella se abre camino: no se le transmite ningún conocimiento humano (“hay que proteger al rey”, “es importante dominar el centro”, “una dama vale nueve puntos y una torre cinco” ni ninguna otra noción que los humanos hemos aprendidos tras siglos jugando ajedrez), y por esos sus partidas muestran un enfoque tan poco ortodoxo que tiene perplejo al mundo ajedrecístico. Ella misma crea sus principios, sus modelos, a partir de cero (por eso su nombre).

Más allá del tablero

Pero bueno, al fin y al cabo ya hace muchos años que las computadoras derrotan a los mejores ajedrecistas, así que una máquina que vence a otras no debería levantar tanto revuelo. ¿No?

Solo que el ajedrez no es el objetivo último de DeepMind sino apenas un campo de entrenamiento,  una pista donde aterrizar sus algoritmos de búsqueda y razonamiento, al igual que lo ha sido el go (muchísimo más complejo e intuitivo que el mismo ajedrez) o el shogi.

El objetivo de DeepMind es crear sistemas que puedan resolver cualquier problema, por complejo que sea, y los juegos de tablero son solo el primer paso.

El problema es que, pese a lo que nos pueda parecer a los seres humanos, la realidad es mucho más complicada que el ajedrez, en donde existen reglas inmutables. Por eso muchos cuestionan que un juego de tablero pueda servir de indicador para el progreso de un sistema de inteligencia artificial.

El problema de interactuar con este mundo, imperfecto, imprevisible y en donde todas las reglas tienen su excepción, sigue existiendo para quienes intentan avanzar en este campo de la inteligencia artificial.

Murray Campbell, especialista en inteligencia artificial de IBM y quien fue uno de los creadores de Deep Blue (la computadora que venció a Kasparov hace 21 años), expone otro obstáculo: “AlphaZero  puede elegir una jugada y respaldarla con distintas variantes, pero no es capaz de ‘explicar’ por qué eligió esa jugada. No hemos logrado que sepa explicar los motivos de su escogencia, y ese es un problema grave al tratar de llevar estos algoritmos a otros ámbitos de decisión”.

Nuestra validación

AlphaZero, como fue bautizada esta red neuronal de inteligencia artificial desarrollada por DeepMind, es un gran avance en el desarrollo de esta tecnología. Aprendiendo a jugar solo a partir del conocimiento de las reglas y jugando contra sí misma, se hizo imbatible en los más difíciles juegos de mesa.

El camino por recorrer, sin embargo, es larguísimo.  Mantener una conversación casual con un amigo de forma natural tal vez no nos parezca algo muy complicado, pero lograr que una máquina haga algo parecido es infinitamente más difícil que conseguir la invencibilidad en ajedrez o en Go.

Referencias


Imagen inicial: Pixabay.

Artículos Relacionados

Artículos Recientes

¿Wikipedia está bloqueada en Venezuela?

K amarilla — El régimen de Nicolás Maduro, a través de la operadora pública de acceso a internet, bloqueó la página de Wikipedia que menciona la irrupción de Juan Guaidó como virtual líder ejecutivo del país. Pero el bloqueo no es total.

leer más

¿Tiene información sobre esta noticia?

14 + 6 =

(Puede ser anónimo)


NOTA LEGAL. 1. El grado de certeza asignado por VK a una información noticiosa no debe considerarse un dictamen forense, sino una conclusión experta basada en información y documentos públicos de fuentes consideradas confiables. 2. Las fuentes citadas y conectadas por direcciones URL pueden cambiar o desparecer y su comportamiento no está en control de VerifiKado. 3. La información de este análisis puede cambiar por alguna de estas razones: a) Se agrega nueva información verificada o b) Se retira información considerada inexacta o no confiable. 4. En todo caso, la información se entrega “AS IS”, como se presenta al momento de ser consultada. Más sobre nuestro proceso de verificación.

Comentario de Facebook