A los gigantes tecnológicos les gusta pavonearse de modelos de IA de billones de parámetros que requieren grupos de GPU masivos y costosos. Pero Fastino está adoptando un enfoque diferente.
La startup con sede en Palo Parada dice que ha inventado un nuevo tipo de edificio de maniquí de IA que es intencionalmente pequeña y específica de tareas. Los modelos son tan pequeños, están entrenados con GPU de juegos de grado desvaloración por un valía de menos de $ 100,000 en total, dice Fastino.
El método está atrayendo la atención. Fastino ha obtenido $ 17.5 millones en fondos iniciales dirigidos por Khosla Ventures, el primer inversor de peligro de OpenAI, Fastino le dice exclusivamente a TechCrunch.
Esto lleva la financiación total de la startup a casi $ 25 millones. Recaudó $ 7 millones en noviembre pasado en una ronda previa a la semilla dirigida por VC Arm M12 de Microsoft e Insight Partners.
“Nuestros modelos son más rápidos, más precisos y cuestan una fracción para entrenar mientras superan los modelos insignia en tareas específicas”, dice Ash Lewis, CEO y cofundador de Fastinino.
Fastino ha construido un conjunto de pequeños modelos que vende a clientes empresariales. Cada maniquí se centra en una tarea específica que una empresa podría precisar, como redactar datos confidenciales o resumir documentos corporativos.
Fastino aún no revela las primeras métricas o usuarios, pero dice que su rendimiento está sorprendiendo a los primeros usuarios. Por ejemplo, conveniente a que son tan pequeños, sus modelos pueden entregar una respuesta completa en una sola ficha, dijo Lewis a TechCrunch, mostrando la tecnología dando una respuesta detallada a la vez en milisegundos.
Evento de TechCrunch
Berkeley, CA
|
5 de junio
Todavía es un poco temprano para retener si el enfoque de Fastino se dará cuenta. El espacio de IA Enterprise está empachado, con compañías como Cohere y Databricks asimismo promocionando IA que sobresale en ciertas tareas. Y los fabricantes de modelos SATA centrados en la empresa, incluidos antrópicos y Mistral, asimismo ofrecen modelos pequeños. Siquiera es ningún secreto que el futuro de la IA generativa para la empresa es Probablemente en modelos de idiomas más pequeños y más enfocados.
El tiempo puede sostener, pero un voto de confianza temprano de Khosla ciertamente no duele. Por ahora, Fastino dice que se centra en construir un equipo de IA de vanguardia. Está dirigido a los investigadores de Top AI Labs que no están obsesionados con construir el maniquí más conspicuo o aventajar los puntos de remisión.
“Nuestra organización de contratación se centra mucho en los investigadores que tal vez tengan un proceso de pensamiento contrario sobre cómo se están construyendo modelos de idiomas en este momento”, dice Lewis.
(Tagstotranslate) Enterprise