Página 1 de 1

Noticias de AlphaZero

Publicado: 25 Nov 2018 22:53
por Javier Ros
Parece que dentro de poco podremos ver de nuevo a AlphaZero en acción:

https://perlenvombodensee.wordpress.com ... -wm-match/

De momento podemos ver sus comentarios sobre el match del Campeonato del Mundo Carlsen-Caruana

https://chess24.com/en/read/news/alphaz ... -games-1-8

Re: Noticias de AlphaZero

Publicado: 26 Nov 2018 22:46
por meca
Te enteras de todo Javier :smile2:

Re: Noticias de AlphaZero

Publicado: 29 Nov 2018 11:51
por Javier Ros
meca escribió:
26 Nov 2018 22:46
Te enteras de todo Javier :smile2:
Gracias, hago lo que puedo. :)

La verdad es que todo este asunto de AlphaZero y LeelaChessZero ha supuesto una revolución en el panorama del ajedrez computado y ha despertado mi interés de forma especial.

Más noticias sobre una segunda versión de AlphaZero de Deepmind, que parece verá la luz en unas semanas con interesantes novedades:

https://groups.google.com/forum/#!topic ... RlSX5nYqv8

Re: Noticias de AlphaZero

Publicado: 30 Nov 2018 01:55
por Jugador
En mi opinion, seria una sorpresa que puede ser mucho mas fuerte que AlphaZero 1 (como la diferencia con el primero AlphaGo) si el hardware es lo mismo... gracias por la noticia!

Re: Noticias de AlphaZero

Publicado: 07 Dic 2018 00:26
por Javier Ros
Finalmente se ha publicado el artículo de AlphaZero tras ser revisado y aceptado para su publicación.

Además se han publicado más datos y partidas de AlphaZero, ver

https://deepmind.com/blog/alphazero-she ... gi-and-go/

Re: Noticias de AlphaZero

Publicado: 08 Dic 2018 13:37
por Javier Ros
Más noticias sobre AlphaZero que pueden afectar a la evolución de LeelaChessZero!!

Matthew Lai fue el creador de Giraffe, programa precursor de AlphaZero, ver

https://motherboard.vice.com/en_us/arti ... atthew-lai

aquí tenéis su Trabajo Fin de Master sobre Giraffe

https://arxiv.org/pdf/1509.01549.pdf

Pues bien, resulta que en el foro Talkchess se ha puesto en contacto con algunos de los programadores de Leela Chess Zero y les ha explicado algunas de las dudas que tenían sobre AlphaZero, ver

http://talkchess.com/forum3/viewtopic.p ... 5&start=60


http://talkchess.com/forum3/viewtopic.p ... 5&start=80

algunas de ellas podrían explicar el mal juego de Lc0 en el final de partida:

Post by Gian-Carlo Pascutto » Fri Dec 07, 2018 7:48 pm

"matthewlai wrote: ↑Fri Dec 07, 2018 11:49 am
During training, we do softmax sampling by visit count up to move 30. There is no value cutoff. Temperature is 1.
This is a rather important difference and will explain a lot about Leela Chess Zero's endgame problems."

Thanks for clarifying some of these things. The 0..1 vs -1..1 range thing is a bit funny. I interpreted the paper as 0..1 initially because that's what older MCTS papers used, then people pointed out that the AZ papers work on a -1..1 range and we changed things. And now it turns out the original version was what AZ had after all.
Yes, all values are initialized to loss value.
Were other settings ever considered, notably 0.5 or parent?

Además también se ha publicado el pseudocódigo de A0 en el material complementario.

Por tanto se esperan mejoras importantes en Lc0 proximamente!!