Cohere vara una comunidad de modelos multilingües abiertos

0
16
Cohere vara una comunidad de modelos multilingües abiertos

Cohere vara una comunidad de modelos multilingües abiertos

La empresa de IA empresarial Cohere lanzó una nueva comunidad de modelos multilingües al beneficio de la Cumbre de IA de la India en curso. Los modelos, denominados Tiny Aya, son de peso descubierto (lo que significa que su código subyacente está acondicionado públicamente para que cualquiera pueda usarlo y modificarlo), admiten más de 70 idiomas y pueden ejecutarse en dispositivos cotidianos como computadoras portátiles sin pobreza de una conexión a Internet.

El maniquí, enérgico por Cohere Labs, el valedor de investigación de la compañía, admite idiomas del sur de Asia como bengalí, hindi, punjabi, urdu, gujarati, tamil, telugu y marathi.

El maniquí pulvínulo contiene 3.350 millones de parámetros, una medida de su tamaño y complejidad. Cohere todavía lanzó TinyAya-Completo, una lectura optimizada para seguir mejor los comandos del sucesor, para aplicaciones que requieren un amplio soporte de idiomas. Las variantes regionales completan la comunidad: TinyAya-Earth para las lenguas africanas; TinyAya-Fire para idiomas del sur de Asia; y TinyAya-Water para Asia Pacífico, Asia occidental y Europa.

Créditos de imagen: Coherir

“Este enfoque permite que cada maniquí desarrolle una pulvínulo filología y matices culturales más sólidos, creando sistemas que se sienten más naturales y confiables para las comunidades a las que deben servir. Al mismo tiempo, todos los modelos Tiny Aya conservan una amplia cobertura multilingüe, lo que los convierte en puntos de partida flexibles para una veterano acoplamiento e investigación”, dijo la compañía en un comunicado.

Cohere señaló que estos modelos, que fueron entrenados en un solo especie de 64 GPU H100 (un tipo de chip de incorporación potencia de Nvidia) utilizando fuentes informáticas relativamente modestas, son ideales para investigadores y desarrolladores que crean aplicaciones para audiencias que hablan idiomas nativos. Los modelos son capaces de ejecutarse directamente en dispositivos, por lo que los desarrolladores pueden utilizarlos para impulsar la traducción sin conexión. La compañía señaló que desarrolló su software subyacente para adaptarse al uso en el dispositivo, requiriendo menos potencia informática que la mayoría de los modelos comparables.

Créditos de imagen: Coherir

En países lingüísticamente diversos como la India, este tipo de capacidad compatible sin conexión puede desplegar un conjunto diverso de aplicaciones y casos de uso sin la pobreza de un llegada constante a Internet.

Los modelos están disponibles en HuggingFace, la popular plataforma para compartir y probar modelos de IA, y en Cohere Platform. Los desarrolladores pueden descargarlos en HuggingFace, Kaggle y Ollama para su implementación tópico. La compañía todavía está publicando conjuntos de datos de capacitación y evaluación en HuggingFace y planea propagar un documentación técnico que detalla su metodología de capacitación.

Evento tecnológico

Boston, Massachusetts
|
23 de junio de 2026

El director ejecutante de la startup, Aidan Gómez, dijo el año pasado que la empresa planea salir a bolsa “pronto”. De acuerdo a CNBCla compañía cerró 2025 con una nota incorporación, publicando 240 millones de dólares en ingresos recurrentes anuales, con un crecimiento del 50% trimestre tras trimestre a lo grande del año.

Descifrar más Tech News in Spanish