Monday, March 10, 2025

Cómo la compañía china Deepseek lanzó un maniquí de razonamiento de IA superior a pesar de las sanciones de los Estados Unidos

Los gigantes tecnológicos como Alibaba y Bytedance, así como un puñado de startups con inversores con faltriquera, dominan el espacio de IA chino, lo que lo hace desafiante para las pequeñas o medianas empresas para competir. Una empresa como Deepseek, que no tiene planes de cobrar fondos, es rara.

Zihan Wang, el ex empleado de Deepseek, dijo Revisión de la tecnología del MIT que tenía golpe a abundantes fortuna informáticos y se le dio sencillez para constatar cuando trabajaba en Deepseek, “un pompa que pocos graduados frescos obtendrían en cualquier empresa”.

En Una entrevista con el Outlet de Medios Chino 36Kr en julio de 2024 Liang dijo que un desafío adicional que enfrentan las empresas chinas en la cima de las sanciones de chips, es que sus técnicas de ingeniería de IA tienden a ser menos eficientes. “Nosotros (la mayoría de las empresas chinas) tenemos que consumir el doble de potencia informática para conseguir los mismos resultados. Combinado con las brechas de eficiencia de datos, esto podría significar carecer hasta cuatro veces más potencia informática. Nuestro objetivo es cerrar continuamente estos huecos ”, dijo.

Pero Deepseek encontró formas de resumir el uso de la memoria y acelerar el cálculo sin martirizar significativamente la precisión. “Al equipo le encanta convertir un desafío de hardware en una oportunidad para la innovación”, dice Wang.

El propio Liang permanece profundamente involucrado en el proceso de investigación de Deepseek, ejecutando experimentos yuxtapuesto a su equipo. “Todo el equipo comparte una civilización colaborativa y dedicación a la investigación hardcore”, dice Wang.

Por otra parte de priorizar la eficiencia, las empresas chinas están adoptando cada vez más los principios de código extenso. Alibaba Cloud ha enérgico más de 100 nuevos modelos de IA de código extenso, admitiendo 29 idiomas y atendiendo a diversas aplicaciones, incluida la codificación y las matemáticas. Del mismo modo, startups como Minimax y 01.Ai han recibido sus modelos abiertos.

Según un Compendio Blanco publicado el año pasado por la Entidad de Información y Tecnología de Comunicaciones de China, un instituto de investigación afiliado al estado, el número de modelos de idiomas grandes de IA en todo el mundo ha cogido los 1.328, con un 36% de origen en China. Esto posiciona a China como el segundo anciano contribuyente a la IA, detrás de los Estados Unidos.

“Esta vivientes de jóvenes investigadores chinos se identifica fuertemente con la civilización de código extenso porque se benefician mucho de ella”, dice Thomas Qitong Cao, profesor asistente de política tecnológica en la Universidad de Tufts.

Jimit Patel
Jimit Patelhttps://butterword.com
📰 Periodista Independiente | 🌎 Entusiasta de las noticias latinoamericanas | Jimit Patel, un periodista consumado, entrega artículos de noticias confiables en español. Su escritura genera conversaciones, resuena con matices latinoamericanos y cubre eventos mundiales, estilo de vida, negocios, política, entretenimiento, viajes, deportes y tecnología.

Related Articles

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

STAY CONNECTED

326,453FansMe gusta
23,963SeguidoresSeguir
75,376SeguidoresSeguir

Latest Articles