¿Sabías que DeepMind consiguió generar un algoritmo DL que derrotó a los mejores jugadores de Starcraft II? Esta inteligencia artificial, a la que denominaron AlphaStar, logró derrotar a algunos de los mejores jugadores del mundo, como TLO y MaNa. DeepMind ya había mostrado su superioridad en juegos como el ajedrez y el shogi, pero hasta entonces no se había probado una IA contra jugadores humanos y, mucho menos, jugadores profesionales.
El algoritmo DL que derrotó a los mejores jugadores de Starcraft II
Starcraft y Starcraft II
Para entender un poco cómo pudo crearse un algoritmo DL que derrotó a los mejores jugadores de Starcraft II, entendamos cómo funciona el juego.
StarCraft es un videojuego de estrategia en tiempo real y género de ciencia ficción que fue creado por Blizzard Entertainment. Se lanzó en 1998 y, a lo largo del tiempo, ha sido adaptado para diferentes plataformas.
Se encuentra ambientado en el siglo XXVI, una época dominada por tres razas que provienen de distintos planetas y luchan por su prevalencia en el planeta. Estas razas corresponden a los Terran, humanos exiliados de la tierra; los Zerg, insectoides parasitarios que buscan la perfección genética y los Protoss, alienígenas humanoides con grandes habilidades tecnológicas.
Starcraft II es la secuela de StarCraft y narra el destino de las tres razas.
Un juego de estrategia
¿Cómo se juega StarCraft II? Cada jugador comienza con una cantidad de trabajadores que van reuniendo recursos para construir sus propias estructuras y crear nuevas tecnologías. De manera progresiva, se va gestionando la economía del mundo en el que cada jugador se encuentra y genera capacidades especiales para derrotar al oponente.
Tanto el macro como el microgame son importantes en este juego. Precisamente en esto radica la dificultad de crear un algoritmo DL que derrotó a los mejores jugadores del mundo: hay que aprender a equilibrar la balanza, a plantear objetivos a corto y largo plazo dentro del juego y a generar estrategias para situaciones posibles e inesperadas dentro del juego.
Debido a la cantidad de posibilidades que existen para generar estrategias dentro del juego, el hecho de crear un algoritmo DL que derrotó a los mejores jugadores implicó un avance tremendamente significativo en el sector IA, ya que AlphaStar necesitó aprender a explorar y expandir de manera continua las fronteras del conocimiento estratégico (así lo planteó DeepMind).
¿Cómo funciona Alphastar?
Alphastar, la IA con el algoritmo DL que derrotó a los mejores jugadores de Starcraft II, tiene un comportamiento generado por una red neuronal profunda que recibe datos de la interfaz del juego sin procesar y que produce acciones dentro del juego.
Alphastar funciona un poco como el aprendizaje reforzado, creando una arquitectura de red neuronal que aplica un torso de transformador a las unidades y que está combinado con un núcleo LSTM profundo, un encabezado de política autorregresivo, una red de puntero y una línea de base de valor centralizada.
Esta IA, con el algoritmo DL que derrotó a los mejores jugadores, utiliza aprendizaje multiagente. Se entrenó primero con aprendizaje supervisado para evaluar su desempeño en juegos humanos anónimos lanzados por Blizzard. Esto le permitió aprender por medio de la imitación, la composición y estrategias del micro y el macrogame.
¿Alguna vez te has planteado que podrías crear tu propia inteligencia artificial o tu propio videojuego? En Keepcoding te animamos a ello y, para ayudarte en el proceso, no puedes perderte nuestro Bootcamp Data Science. En esta formación intensiva podrás acceder a la teoría y práctica necesaria para lograr un ascenso profesional y personal. ¡No esperes más para seguir aprendiendo y cumplir tus sueños! ¡Anímate a cambiar tu vida y solicita más información!