Sin una sola ecuación ni una palabra rara (aunque algún que otro taco). En dos minutos.
Tu primer día de trabajo
Acabas de empezar en un nuevo trabajo y no sabes muy bien qué hay que hacer; la oferta era un poco misteriosa en ese sentido. Sin embargo, hay algo que estaba muy claro desde el principio: se pagaba muy, pero que muy bien.
Al poco de llegar se presenta un señor muy fornido, con manos como palas. Al principio te resulta familiar, pero no terminas de localizarlo, hasta que lo reconoces: se trata del ¡gran Vasily Kamotsky, el granjero siberiano que se convirtió en el rey de los concursos de bofetadas!
Vasily te dice, con marcado acento ruso:
—Soy tu nuevo SUPERVISOR.
Acto seguido, te enseña una hoja de cálculo llena de números decimales, sin ningún otro tipo de información, y te pregunta con tono amenazador:
—¿Es esto un huargo?
Sin entender nada, dudas:
—¿Cómo dice?
—¡Respuesta equivocada! —dice Vasily mientras te calza una bofetada que hace que te suene la cara a lata.
Aún no estás recuperado, cuando te repite la misma extraña pregunta:
—¿Es esto un huargo?
—¡No lo sé!
—¡Respuesta equivocada! —vuelve a decir Vasily, poco antes de que su mano se descargue de nuevo sobre tus carrillos.
Imperturbable, te hace la misma pregunta. Parece ser que quiere oír un sí o un no. Aunque no tienes ni idea de qué es un huargo ni qué tiene eso que ver con la hoja de cálculo que te enseña, por quitártelo de encima, pruebas a decir:
—¡Sí!
Hoy estás teniendo mala suerte, porque resulta que es la respuesta equivocada y aterriza otra bofetada demoledora en tu mejilla.
Vasily repite la pregunta mientras te enseña la hoja de cálculo y escupe sobre la palma de la mano, preparando su respuesta. Esta vez, contestas:
—¡NO!
Y cierras los ojos por si acaso.
Para tu sorpresa, el golpe no llega jamás. Con una sonrisa de oreja a oreja, Vasily grita:
—¡Respuesta correcta!
Y te entrega un fajo de mil euros.
Mientras aún estás atónito, Vasily te enseña otra hoja de cálculo llena de números y te repite la pregunta:
—¿Es esto un huargo?
¿Es esto un huargo?
Los golpes son tremendos, pero la recompensa es enorme, así que intentas contestar lo que crees que espera Vasily. Ya te has dado cuenta de algunos patrones:
- Si los números son todos casi un cero, casi seguro que la respuesta correcta es un no.
- Si los números del centro son mayores que los de los bordes de la hoja, es más probable que se trate de un sí.
Poco a poco vas mejorando y las bofetadas se van espaciando. Sigues sin saber qué coño es un huargo o de qué va esto, pero estás ganando tanto dinero que decides contratar gente para que te ayude.
Trabajo en equipo
Contratas a 10 personas y las sientas en dos hileras de 5 cada uno. A todos les repites la pregunta mientras enseñas la hoja de cálculo de turno. Dependiendo de lo que opinen ellos, le contestarás a Vasily, tu SUPERVISOR.
En primera fila, hay un señor calvo con cara de idiota. No te fías de él, así que si el dice que NO, tú crees que es más probable que sea un SÍ, y viceversa.
Al fondo hay una señorita con gafas, cara de empollona y pinta de bibliotecaria. Seguro que es lista, así que, tanto si dice que SÍ como si dice que NO, le harás mucho caso.
A la opinión de cada miembro de tu equipo le das un PESO. Cuando la respuesta es equivocada, recorres las dos filas repartiendo bofetadas. Para ser justo, la intensidad de la bofetada es proporcional al PESO de su opinión. Eso sí, cuando la respuesta es correcta, repartes el dinero con tu equipo, también de forma proporcional.
Es usted muy perceptivo
Tú y tu equipo os volvéis unos máquinas y, poco a poco, os estáis forrando. La “bibliotecaria” ya no lleva gafas, tiene el pelo revuelto y parece que le falta algún diente; sin embargo, ya no falla casi nunca. El calvo con cara de tonto ha resultado ser mucho más útil de lo que parecía: él tampoco falla casi nunca, solo hay que decir lo contrario de lo que él diga.
Vasily un día se acerca y te dice:
—Es usted muy perceptivo.
Y como es muy aficionado a poner motes a sus empleados, decide llamarte PERCEPTRON.
Más deprisa
Solo hay un problema: el proceso de preguntar a todos y crear la respuesta del equipo a partir de sus opiniones y los pesos de las mismas resulta muy lento. Quitar gente hace la respuesta más rápida, pero menos eficaz, y nadie quiere contestar mal a Vasily.
Hace falta otra solución.
Los jugones
Te enteras de que, por alguna razón, los aficionados a los videojuegos son muy rápidos dando una respuesta. Contratas a unos cuantos y, para tu sorpresa, son infinitamente más rápidos que la gente normal.
Contratas a cientos de ellos y los distribuyes en filas, igual que antes. Tienes un conjunto de filas de personas muy PROFUNDAS y ahora ya no falláis casi nunca. El dinero fluye y hace meses que no truena la palma de Vasily.
Eso sí, nadie sabe qué coño es un huargo o cuál es su relación con las hojas de cálculo. Alguno sospecha que puede ser la representación de una imagen, donde aparece un huargo (aunque nadie sepa lo que es), pero son solo teorías.
Nadie sabe qué es un huargo ni qué hace Vasily con esa respuesta. Simplemente habéis aprendido a encontrar patrones en la tabla de números.
Un red neuronal
Una red neuronal está compuesta por una red (valga la redundancia) de pequeños componentes sencillos, organizados por filas o capas, que dan una respuesta simple a una pregunta de clasificación. Por ejemplo:
- ¿Hay aquí una cara?
- ¿Es esto un coche?
- ¿La persona de la imagen está sonriendo?
- ¿Este cliente va a pagar su hipoteca?
A la respuesta de cada uno de esos nodos o componentes se le asigna un PESO (un valor numérico). Dicho peso se va ajustando hasta que encontramos los valores óptimos.
Poco a poco, se dice que la red va aprendiendo (optimizando sus pesos).
A una red muy pequeña se le llama perceptron. Dichas redes no son eficaces, pero hasta la llegada de las GPU (procesadores gráficos creados para los videojuegos) no se podían ampliar.
Una GPU es capaz de hacer muchísimos cálculos sobre matrices de números decimales (la hoja de cálculo) y de forma paralela. Las GPU hicieron posible el deep learning o aprendizaje PROFUNDO. Lo de profundo es porque son redes neuronales con filas muy profundas de nodos. Gracias a ellas, el deep learning se convirtió en una herramienta factible y sumamente útil.
Vasily es el SUPERVISOR, porque este es un caso de Aprendizaje Supervisado, en el que “alguien” sabe cuál es la respuesta correcta y corrige cuando hace falta.
El aprendizaje es lento, pero una vez que la red ha aprendido, responder a las preguntas (inferencia) es rápido. No se reparten bofetadas ni fajos de dinero, pero sí se ajustan los pesos.
Las redes neuronales son la herramienta adecuada cuando:
- Hay muchos ejemplos de lo que queremos clasificar.
- El problema es fácil de representar como una matriz de números (como las imágenes).
- El problema es difícil de resolver mediante código.
Pero ChatGPT ¡usa texto, no imágenes!
Calma que ahora lo vemos.
Un nuevo trabajo
Un buen día, te cambian a otro departamento y te asignan otra tarea. Una vez más, hay gran secretismo y no sabes muy bien de qué va la cosa. Nada más llegar, se presenta Vasily y te dice:
—¡Vamos a hacer algo TRANSFORMADOR!
Acto seguido, te entrega un libro inmenso:
Te informan de que son las obras completas de Dostoievski y te las tienes que leer todas para mañana. Al abrirlo, ves un montón de símbolos raros y no entiendes nada.
—Creo que esto está en versión original…
—¡Da! —confirma Vasily.
—Pero oiga, que yo no sé ruso.
—¡No importa! Tú te lo lees todo hoy y mañana empezamos.
Revisas mil veces la lista interminable de símbolos raros sin entender nada, mientras observas con creciente inquietud como Vasily practica en un rincón con sandías.
Al día siguiente, te presentas en tu puesto de trabajo y Vasily ya te está esperando. En vez de una hoja de cálculo, esta vez te entrega una hoja de papel con lo que parece ser un texto en Ruso:
Вот если вы не согласитесь с этим последним тезисом и ответите
Con la mano ya alzada, te dice:
—Este es tu PROMPT. —Y pregunta—: ¿Cómo continuaría esta frase Dostoievski?
—Oiga, que no sé lo que…
Un bofetón te interrumpe y suena el temido “respuesta equivocada”.
Como ya sabes lo que está por venir, te pones a escribir símbolos cirílicos que no entiendes, al tuntún, ante la atenta mirada de Vasily. En un momento te dice:
—PARA DE GENERAR.
Le entregas el folio, lo revisa y te calza otro golpe.
—¡Respuesta equivocada!
Te vuelve a enseñar otro fragmento de texto en ruso, cuyo contenido o significado desconoces por completo, y pregunta:
—¿Cómo continuaría esta frase Dostoievski?
Aprovechando tu conocimiento de antes, montas todo un equipo distribuido en capas. Ahora la pregunta no es “¿es esto un huargo?”, sino que es “a partir de este ejemplo, ¿cuál sería el siguiente símbolo más probable, según la obra de Dostoievski?”.
Repites la pregunta una y otra vez, y en función de lo que va contestando tu equipo, elaboras la respuesta común (el símbolo o letra) que le daréis a Vasily. Repites el proceso, símbolo a símbolo, hasta que Vasily os dice:
—PARA DE GENERAR.
Poco a poco, aunque ninguno habla ruso, vais mejorando y lo que respondéis parece lo que diría Dostoievski. No es simplemente algo que esté en el libro de las obras completas y, ante la misma pregunta, es posible que contestéis algo levemente distinto cada vez que os lo pregunten.
Solo se trata de responder algo que a Vasily le parezca que tiene sentido y que le recuerde el estilo de Dostoievski.
Redes Neuronales y Transformadores
ChatGPT (y otras IA similares) están construidas con un transformador, un tipo de red neuronal creado para generar texto a partir de un pequeño ejemplo o prompt y un corpus de texto enorme. Se trata de continuar el prompt con aquello que sería más probable en el corpus de texto.
En nuestro caso, el corpus es la obra completa de Dostoievski y el prompt es la frase inicial que nos da Vasily.
En el caso de ChatGPT, el prompt es lo que le “preguntas” y el corpus es una parte sustancial de todo el contenido de internet.
Al igual que tú, ChatGPT no entiende nada del texto y no sabe nada. Ni siguiera sabe que le estás preguntando algo, solo se ha vuelto un máquina a la hora de predecir qué es lo que viene después del prompt para que estés contento y le veas sentido.
El futuro: no subestimes 150 mil millones de parámetros
Está claro ya que no estamos ante SkyNet o una inteligencia artificial comparable a un animal avanzado (no necesariamente un humano). Se trata de una herramienta muy específica que nos ayudará a eliminar trabajo idiota.
Sin embargo, lo que marca la complejidad de un cerebro (una red neuronal biológica) es el número de neuronas y el número de sinapsis. Lo más parecido a una sinapsis en una red neuronal serían los pesos que hemos mencionado, o los parámetros.
En estos momentos el número de parámetros en las redes neuronales que se están construyendo está creciendo de forma exponencial (como el covid-19 en 2020). Algunos de los nuevos modelos tienen ¡más de 150 mil millones de parámetros!
Esa cantidad todavía es unas 100 veces menor que el número de sinapsis en el cerebro humano, pero no para de crecer.
¿Es posible que en algunos años o unas décadas surja algo autoconsciente? No lo sabemos, pero ya no se puede descartar. Viviremos tiempos interesantes.