Showing posts with label alphazero. Show all posts
Showing posts with label alphazero. Show all posts
Wednesday, November 27, 2019
Una propuesta de Kramnik para una nueva modalidad de ajedrez
Es claro que el ajedrez es uno de los juegos más estudiados de todos los tiempos. Se genera información y contenidos para ajedrez como en ningún otro juego de mesa. Cada vez hay más programas de ajedrez que juegan a nivel gran maestro de elite, los volúmenes de teoría de aperturas es inmenso y además, está accesible a la mayoría de las personas. Para hacer el caldo más gordo, tenemos a Internet, en donde podemos jugar y ver los torneos más importantes en vivo y en directo.
Esto, sin embargo, hace el ajedrez menos imaginativo. Ya sabemos qué jugadas en ciertas variantes son malas o deficientes y del cómo podemos explotar esto. Por otra parte, en los torneos de elite vemos muchas más tablas, lo cual suena lógico considerando que juegan los mejores del mundo y en esto las diferencias de nivel son mínimas.
Por ello, se han buscado un sinfín de fórmulas para hacer más atractivo el ajedrez a las masas. El Campeonato del Mundo, por ejemplo, ya no se juega como antaño, al mejor de 24 partidas. Sino que ahora se juegan 12 partidas y si hay un empate, se juegan partidas a 25 minutos, a cinco y el Armagedon, que es una última partida en donde el blanco tiene 5 minutos y el negro 4, pero con el empate del segundo jugador, se contabiliza como triunfo. También se ha intentado limitar los empates con reglas como las de "Sofía", en donde los jugadores no pueden empatar antes de la jugada 30 y hoy en día se hacen muchos más torneos de partidas rápidas que antes, porque esto es más "emocionante".
Pero hay quien piensa que el ajedrez se está acabando por tanta teoría de aperturas. Y fue Fischer quien propuso el ajedrez 960 o RandomChess, que hace que las piezas no se puedan poner en la primera fila en el orden acostumbrado, sino que se define al azar. Y ya hasta hay campeón mundial de Fischer Random, que es Wesley So.
Hoy nos enteramos que Vladimir Kramnik, excampeón mundial (y ya retirado de las competencias), se le ha ocurrido que hay que "revivir" el ajedrez. Para ello se contactó con Demis Hassabis, el fundador y CEO de DeepMind, la empresa de Google que trajo AlphaZero, el programa de ajedrez que juega con rdes neuronales y que es, hoy por hoy, probablemente el programa más fuerte del mundo. AlphaZero además, por ser una red neuronal, ha encontrado ideas de largo plazo que convierten sacrificios de peones, por ejemplo, en lanzaderas de ataque. Muchos grandes maestros están ahora aprendiendo de las partidas y conceptos que estamos aprendiendo de este programa.
Hay que decir que Hassabis fue un jugador junior prometedor, que decidió dedicarse a la ciencia. Kramnik habló con él y se organizó el plan para probar algunas ideas para hacer renacer el ajedrez de este letargo, usando para ello AlphaZero. Kramnik trabajó con Ulrich Paquet y Nenad Tomasev, investigadores de DeepMind, quienes modificaron AlphaZero para probar las ideas de Kramnik para tener un ajedrez más creativo.
La idea de Kramnik es quitar el enroque de las reglas del ajedrez. Esta variante da un potencial interesante para que haya más victorias por parte de algún bando pues, a partir de que el rey no puede irse a esconder con el enroque, tendrá que usar muchos tiempos para hacerlo o bien, mantenerse en el centro, asunto que sabemos del ajedrez clásico, es peligroso y los ataques al rey no enrocado son legendarios. La meta es, de acuerdo a Kramnik, reiniciar el interés e introducir a los jugadores y aficionados a la inmensa complejidad y creatividad del juego ciencia.
Se le indicó a AlphaZero que el enroque ya no era una regla válida y se empezaron los experimentos de AlphaZero jugando contra AlphaZero. Los resultados fueron mucho más allá de lo esperado, de acuerdo con el mismo Kramnik. AlphaZero empezó jugando el ajedrez sin enroque desde cero, permitiendo al programa aprender incrementalmente mediante un proceso de prueba y error, igual que el que hizo con el ajedrez clásico. Después de millones de partidas, AlphaZero se convirtió en un experto en el ajedrez sin enroque, lo que nos permitió analizar cómo juega y validar así el balance de las partidas.
Se halló que el porcentaje de triunfos/derrotas para blancas y negras es muy similar al del ajedrez clásico, sugiriendo este dato el hecho de que quitar el enroque no favorece a ningún jugador. Prevenir que el rey pueda esconderse en un lado del tablero hizo que las partidas fuesen más dinámicas y entretenidas.
Kramnik da algunos datos interesantes: Cuando AlphaZero jugó con todo el nivel en controles de tiempo largos, se tuvieron partidas muy dinámicas pero parejas. Cuando se le daba a AlphaZero una fracción del tiempo para meditar, es decir, un segundo por jugada, con cierto "ruido" inyectado en el proceso de decisión para ayudar al aprendizaje, hubo más margen para el error. Las blancas ganaron 33% de las partidas, las negras 23% y 44% de las partidas terminaron en empates.
De acuerdo con Kramnik, las ventajas de esta modalidad de ajedrez son muchas. Por ejemplo, el no poderse enrocar hace que los jugadores no puedan usar los patrones conocidos y tengan que pensar desde el principio. Para el excampeón del mundo, es imposible jugar a las tablas, porque el rey en el centro es siempre inseguro y se requeriría mucho tiempo para poder salir a una esquina del tablero. Por otra parte, un aficionado podría competir contra un jugador más avezado en la teoría de aperturas tradicional, porque aquí la falta del enroque cambia de plano muchas cosas.
Kramnik piensa que esta modalidad permitiría un incremento en el número decisivo de partidas, mucho más allá del 50%. Estima el excampeón mundial que habría una explosión de creatividad y de nuevas ideas.
La modalidad de Kramnik se ve mucho más interesante que la de Fischer Random. El hecho de que el ajedrez parece igual pero sin el enroque, es probablemente una de las variantes de ajedrez más interesantes. Habrá que ver si la idea pega y se hacen torneos de esta naturaleza. Lo que sí me queda claro es que esta modalidad podría tener mucha más aceptación que el ajedrez azaroso de Fischer.
Thursday, December 07, 2017
AlphaZero es el nuevo súper gran maestro, ¿es eso muy grave?
Hace un par de días se dio la noticia de que AlphaZero y su algoritmo de aprendizaje reforzado, había sido aplicado al juego del ajedrez y en sólo cuatro horas, el sistema había aprendido a a jugar un ajedrez de súper gran maestro a partir del único conocimiento de cómo se movían las piezas. Los investigadores de DeepMind, que es una empresa de Google, pusieron a jugar a su invento contra uno de los mejores programas de ajedrez, StockFish, el cual es además de código abierto. Jugaron 100 partidas y AlphaZero venció 28-0 con 72 empates. Es decir, la máquina de Google no perdió una sola partida. Verdaderamente asombroso.
Y esto, por supuesto, como seres humanos, nos hace pensar si este nuevo algoritmo de redes neuronales es capaz de sintetizar en 4 horas 500 años de lo que sabemos de ajedrez y sin siquiera alimentárselo. Si pensamos en los esfuerzos que se han hecho desde los años sesentas del siglo pasado en el campo de ajedrez por computadora, podemos observar un desarrollo sistemático y muy lento para llegar a tener motores de ajedrez como Komodo, Houdini o StockFish. Y lo que hizo AlphaZero parece ser el parte aguas el cual puede modificar de por vida la manera en como vemos el ajedrez.
Pero yo creo que el avance científico no tiene siquiera que estar peleado con el propio ajedrez. Ahora dispondremos de una herramienta mucho más poderosa que la anterior. Cabe por ejemplo señalar, que ya los programas como Houdini o Komodo, le ganan al 99.95% de los jugadores en todo el mundo y que desde el año 2000 aproximadamente, debido a los avances de cómputo, ya ni siquiera se hacen esos espectaculares encuentro de grandes maestros contra las computadoras. La razón es simple: ya nos ganó la técnica. Ya no podemos competir a la frialdad de los cálculos y valoraciones de árboles de variantes gigantescos. Vamos, el juego no estará resuelto oficialmente, pero ya lo está en la práctica.
Y entonces, AlphaZero es como una motocicleta en una carrera de 100 metros planos de seres humanos. Simplemente no podemos competir contra ella y listo. Pero eso no acabó con las carreras de los seres humanos y la razón es simple: sí, tenemos artefactos y dispositivos que juegan muy bien y mucho mejor que nosotros, los seres humanos, pero que en el fondo tienen otra naturaleza diferente al de la raza humana. Yo simplemente no me preocuparía tanto.
Creo que el alcance de AlphaZero será importante y modificará algunos aspectos de cómo vemos el ajedrez pero de ahí a decir que ya hay que guardar nuestras piezas y peones para siempre, me parece que no debe ser así. AlphaZero habla finalmente de algo importante: sabemos muy poco de ajedrez y ahora tenemos una herramienta formidable. Usémosla. Aprendamos de ella y sigamos dando jaques.
¿Por qué no?
¿El fin del ajedrez?
En 1997 Garry Kasparov perdía un match a seis partidas contra una máquina preparada sólo para jugar al ajedrez. IBM había puesto mucho dinero y su plan era demostrar que una máquina ya tenía la suficiente capacidad para derrotar al mejor jugador del mundo en este difícil arte del ajedrez. Pero 20 años después nos enteramos que DeepMind había puesto un programa llamado AlphaGo, a jugar contra el mejor jugador del juego chino Go, y que le había derrotado sin duda ninguna. Hoy DeepMind nos da la noticia que su programa, aplicado al ajedrez, logró en sólo cuatro horas de auto entrenamiento, el nivel de súper gran maestro y para ello ha usado su técnica de redes neuronales de aprendizaje reforzado. AlphaGo ha logrado entender más de 500 años de experiencia en ajedrez en tan sólo unas horas. Algo inconcebible e impresionante.
El algoritmo desarrollado por Google y DeepMind, sintetiza todo el conocimiento del ajedrez y para demostrar este nivel, los investigadores decidieron poner como rival a StockFish, el mejor programa de ajedrez de código abierto, que está entre los tres mejores programas (incluyendo los comerciales), del mundo.
AlphaGo venció a Stockfish en un encuentro a 100 partidas, por 28-0 y 72 empates. Es decir, el poderoso StockFish no pudo ganar una sola partida. Esto solamente habla de la capacidad del algoritmo de DeepMind, el cual ni siquiera necesita bases de partidas, tablas de finales o podas alpha-beta para correr.
El artículo “Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm” describe el trabajo realizado y sin duda es un parteaguas en el mundo del ajedrez por computadora. El enfoque es tan diferente a todo lo anterior hecho en esta disciplina que habrá que estudiar cómo es que este algoritmo de Google y DeepMind se está volviendo una de las maneras más eficientes para atacar problemas que no tienen solución definitiva y que se han atacado antes a través de heurísticas
Subscribe to:
Posts (Atom)