El padre de AlphaGo cree que la IA va por mal camino
Photo via Unsplash
David Silver, el investigador que puso a AlphaGo en el mapa, no cree que los grandes modelos de lenguaje sean el futuro de la inteligencia artificial — y acaba de apostar mil millones de dólares para demostrarlo. Su nueva empresa busca construir lo que él llama "superlearners": sistemas de IA que aprendan de verdad, no que memoricen. En un campo donde todo el mundo corre en la misma dirección, eso es una declaración de guerra.
El hombre que venció al campeón mundial de Go
Silver es el arquitecto principal de AlphaGo, el sistema de DeepMind que en 2016 derrotó a Lee Sedol, el mejor jugador de Go del mundo. Esa victoria no fue un truco de marketing: fue un momento bisagra que demostró que la IA podía dominar tareas consideradas imposibles para las máquinas. Silver lleva décadas trabajando en aprendizaje por refuerzo, una rama de la IA muy diferente al enfoque de los LLMs que hoy dominan el debate público.
Mil millones para replantear la IA desde cero
Silver ha fundado una nueva startup con una financiación inicial que ronda los mil millones de dólares, según Wired. El objetivo es desarrollar agentes de IA basados en aprendizaje por refuerzo profundo, capaces de mejorar su rendimiento a través de la experiencia directa en lugar de depender únicamente de datos de entrenamiento estáticos. La empresa aún no tiene nombre público ni producto lanzado, pero el respaldo financiero ya la coloca en el radar de la industria. Silver argumenta que el paradigma actual de los LLMs — entrenar modelos masivos con texto de internet — tiene límites fundamentales que no se pueden escalar indefinidamente.
Lo que Silver está diciendo en voz alta que otros piensan en silencio
La crítica de Silver no es nueva dentro de los laboratorios de investigación, pero pocas personas con su credibilidad la dicen en público con tanto dinero detrás. La apuesta es clara: el camino hacia la inteligencia artificial general no pasa por hacer los modelos de lenguaje más grandes, sino por construir sistemas que puedan aprender, explorar y adaptarse como lo hace un ser humano. Si tiene razón, OpenAI, Anthropic y Google tienen un problema serio. Si se equivoca, habrá quemado mil millones de dólares en una idea elegante.
El efecto dominó que esto puede generar
Que alguien del calibre de Silver mueva fichas en esta dirección puede redirigir el capital y el talento de investigación hacia el aprendizaje por refuerzo en un momento en que casi todos los focos apuntan a los transformers. Esto podría:
- Revivir el interés institucional en enfoques alternativos a los LLMs
- Presionar a los grandes labs a diversificar sus apuestas de investigación
- Abrir un debate real sobre si el escalado de parámetros tiene fecha de caducidad
La industria lleva dos años en modo "más grande es mejor". Silver está apostando a que esa era ya tocó techo.
Si el creador de AlphaGo tiene razón, el próximo gran salto en IA no vendrá de un modelo de lenguaje más potente, sino de una máquina que sepa aprender de sus propios errores — y eso cambia todo.
Fuente: Wired