La mayoría de las grandes empresas de tecnología ahora cuentan con versiones de tamaño divertido de sus modelos insignia para este propósito: OpenAI ofrece GPT-4o y GPT-4o mini; Google DeepMind tiene Gemini Extremely y Gemini Nano; y Claude 3 de Anthropic viene en tres versiones: Opus de gran tamaño, Sonnet de tamaño mediano y Haiku diminuto. Microsoft es pionero en una gama de modelos de lenguajes pequeños llamados Phi.
Un número cada vez mayor de empresas más pequeñas también ofrecen modelos pequeños. La startup de IA Author afirma que su último modelo de lenguaje iguala el rendimiento de los modelos más grandes de primer nivel en muchas métricas clave a pesar de que en algunos casos tiene solo una vigésima parte de parámetros (los valores que se calculan durante el entrenamiento y determinan cómo se comporta un modelo). .
Explora el completo Lista 2025 de 10 tecnologías innovadoras.
Los modelos más pequeños son más eficientes, lo que los hace más rápidos de entrenar y ejecutar. Esas son buenas noticias para cualquiera que desee una rampa de acceso más asequible. Y también podría ser bueno para el clima: como los modelos más pequeños funcionan con una fracción de la potencia informática que requieren sus primos gigantes, queman menos energía.
Estos modelos pequeños también viajan bien: pueden funcionar directamente en nuestros bolsillos, sin necesidad de enviar solicitudes a la nube. Lo pequeño es la próxima gran novedad.