TECNOLOGÍA

El soneto de Claude 3.7 de Anthrope apunta a Operai y Deepseek en la próxima gran batalla de AI

February 24, 2025

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información

Antrópico Acabo de disparar un disparo de advertencia a Opadai, Fogueado y toda la industria de IA con el emanación de Tirar 3.7 Sonetoun maniquí que brinda a los usuarios un control sin precedentes sobre cuánto tiempo pasa una IA “pensamiento“Antiguamente de originar una respuesta. El emanación, inmediato con el inauguración de Tirar Códigoun agente de codificación de AI de bisectriz de comandos, señala el impulso agresivo de Anthrope en el mercado de IA Enterprise, un impulso que podría remodelar cómo las empresas crean software y automatizan el trabajo.

Las apuestas no podrían ser más altas. El mes pasado, Deepseek sorprendió al mundo tecnológico con un maniquí de IA que coincidía con las capacidades de los sistemas estadounidenses en un fracción del costoenviando a Nvidia stock bajó 17% y planteando alarmas sobre el liderazgo de IA de Estados Unidos. Ahora Anthrope está apostando a que el control preciso sobre el razonamiento de la IA, no solo la velocidad cruda o el hucha de costos, le dará una superioridad.

Claude 3.7 Sonnet presenta una relevo de ‘modo de pensamiento’, lo que permite a los usuarios optimizar el tiempo de respuesta de la IA en función de la complejidad de la tarea. (Crédito: antrópico)

“Simplemente creemos que el razonamiento es una parte central y un componente central de una IA, en superficie de una cosa separada a la que tiene que fertilizar por separado para alcanzar”, dijo Dianne Penn, quien dirige la mandato de productos para la investigación en Anthrope, en una entrevista con VentureBeat . “Al igual que los humanos, la IA debe manejar respuestas rápidas y un pensamiento arduo. Para una pregunta simple como ‘¿Qué hora es?’, Debería replicar al instante. Pero para tareas complejas, como planificar un delirio de dos semanas en Italia al tiempo que acomoda las deyección dietéticas sin gluten, necesita un tiempo de procesamiento más extenso “.

“No vemos razonamiento, planificación y autocorrección como capacidades separadas”, agregó. “Por lo tanto, esta es esencialmente nuestra forma de expresar esa diferencia filosófica … idealmente, el maniquí en sí debería rebuscar cuándo un problema requiere un pensamiento y ajuste más intensivo, en superficie de exigir a los usuarios que seleccionen explícitamente diferentes modos de razonamiento”.

Una comparación de los modelos AI muestra el rendimiento del soneto de Claude 3.7 en varias tareas, con ganancias notables en capacidades de pensamiento extendido en comparación con su predecesor. (Crédito: antrópico)

Los datos de relato respaldan la ambiciosa visión de Anthrope. En modo de pensamiento extendido, Claude 3.7 Sonnet logra 78.2% precisión en tareas de razonamiento a nivel de posgrado, desafiando los últimos modelos de OpenAI y superan a Deepseek-R1.

Pero las métricas más reveladoras provienen de aplicaciones del mundo vivo. Los puntajes del maniquí 81.2% en el uso de la utensilio minorista y muestra mejoras marcadas en Following de instrucciones (93.2%) – Áreas donde los competidores han tenido problemas o no han publicado resultados.

Mientras que Deepseek y OpenAi conducen en puntos de relato de matemáticas tradicionalesEl enfoque unificado de Claude 3.7 demuestra que un solo maniquí puede cambiar efectivamente entre respuestas rápidas y examen profundos, eliminando potencialmente la indigencia de que las empresas mantengan sistemas de IA separados para diferentes tipos de tareas.

Cómo la IA híbrida de Anthrope podría remodelar la computación empresarial

El momento de la independencia es crucial. El surgimiento de Deepseek el mes pasado enviado ondas de choque a través de Silicon Valley, demostrando que se podría ganar un razonamiento sofisticado de IA con mucho menos potencia informática que anteriormente pensado. Esto desafió los supuestos fundamentales sobre los costos de avance de IA y los requisitos de infraestructura. Cuando Deepseek publicó sus resultados, las acciones de Nvidia cayó un 17% En un solo día, los inversores cuestionan de repente si las chips caros eran verdaderamente esenciales para la IA descubierta.

Para las empresas, las apuestas no podrían ser más altas. Las empresas son Pagar millones Integrando la IA en sus operaciones, apuestas sobre qué enfoque dominará. El maniquí híbrido de Anthrope ofrece una ruta media convincente: la capacidad de ajustar el rendimiento de la IA en función de la tarea en cuestión, desde respuestas instantáneas del servicio al cliente hasta un examen financiero arduo. El sistema mantiene el antrópico precios anteriores de $ 3 por millón de tokens de entrada y $ 15 por millón de tokens de salida, incluso con características de razonamiento adicionales.

Claude 3.7 Sonnet presenta una relevo de ‘modo de pensamiento’, lo que permite a los usuarios optimizar el tiempo de respuesta de la IA en función de la complejidad de la tarea. (Crédito: antrópico)

“Nuestros clientes están tratando de ganar resultados para sus clientes”, explicó Michael Gerstenhaber, jerarca de plataforma de Anthrope. “Usar el mismo maniquí y provocar el mismo maniquí de diferentes maneras permite a determinado como Thompson Reuters Para hacer investigación admitido, permite que nuestros socios de codificación sean como Cursor o Github poder desarrollar aplicaciones y cumplir con esos objetivos “.

El enfoque híbrido de Anthrope representa tanto una desarrollo técnica como un gambito importante. Mientras OpenAi mantiene modelos separados para diferentes capacidades y Deepseek se centra en eficiencia de rentabilidadAnthrope está buscando sistemas unificados que puedan manejar tareas rutinarias y razonamiento arduo. Es una filosofía que podría remodelar cómo las empresas implementan IA y eliminar la indigencia de hacer malabarismos con múltiples modelos especializados.

Conozca el código Claude: el nuevo asistente de desarrollador de AI

Anthrope hoy incluso revelado Tirar Códigouna utensilio de bisectriz de comandos que permite a los desarrolladores delegar tareas de ingeniería complejas directamente a la IA. El sistema requiere la aprobación humana ayer de cometer cambios en el código, lo que refleja el enfoque creciente de la industria en el avance responsable de la IA.

La interfaz terminal de Claude Code, parte de la nueva suite de herramientas de desarrollador de Anthrope, enfatiza la simplicidad y la interacción directa. (Crédito: antrópico)

“En efectividad, todavía tienes que aceptar los cambios que hace Claude. Eres un revisor con la rueda actos (la) rueda ”, señaló Penn. “Hay esencialmente una especie de tira de comprobación que debe aceptar esencialmente para que el maniquí tome ciertas acciones”.

Los anuncios vienen en medio de una intensa competencia en el avance de la IA. Investigadores de Stanford recientemente creó un maniquí de razonamiento de código hendido por menos de $ 50, mientras que Microsoft simplemente se integró Maniquí O3-Mini de Openai en garzo. El éxito de Deepseek incluso ha estimulado nuevos enfoques para el avance de la IA, y algunas compañías exploran técnicas de destilación maniquí que podrían dominar aún más los costos.

La interfaz de bisectriz de comandos del código Claude permite a los desarrolladores delegar tareas de ingeniería complejas mientras mantienen la supervisión humana. (Crédito: antrópico)

De Pokémon a Enterprise: Probar la nueva inteligencia de AI

Penn ilustró el progreso dramático en las capacidades de IA con un ejemplo inesperado: “Hemos estado pidiendo diferentes versiones de Claude para interpretar a Pokémon … esta traducción ha llegado hasta Ciudad de bermellonescapturó múltiples Pokémon, e incluso se muelen para subir de nivel. Tiene el Pokémon correcto para batallar contra los rivales “.

“I think you’ll see us continue to innovate and push on the quality of reasoning, push towards things like dynamic reasoning,” Penn explained. “Siempre hemos pensado en ello como una parte central de la inteligencia, en superficie de poco separado”.

La prueba vivo del enfoque de Anthrope vendrá de la acogida empresarial. Si admisiblemente recrearse Pokémon puede parecer trivial, demuestra el tipo de inteligencia adaptativa que las empresas necesitan: AI que puede manejar las operaciones de rutina y las decisiones estratégicas complejas sin cambiar entre modelos especializados. Las versiones anteriores de Claude no podían navegar más allá de la ciudad auténtico de un surtido. La última traducción crea estrategias, gestiona fortuna y toma decisiones tácticas, capacidades que reflejan la complejidad de los desafíos comerciales del mundo vivo.

Para los clientes empresariales, esto podría significar la diferencia entre amparar múltiples sistemas de IA para diferentes tareas e implementar una opción única y más capaz. Los próximos meses revelarán si la envite de Anthrope por el razonamiento de AI unificado remodelará el mercado empresarial o se convertirá en otro tentativa en la rápida desarrollo de la industria.

Insights diarias sobre casos de uso comercial con VB diariamente

Si quieres impresionar a tu jerarca, VB Daily te tiene cubierto. Le damos la cuenta interior de lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, por lo que puede compartir ideas para el ROI mayor.

Interpretar nuestro política de privacidad

Gracias por suscribirse. Mira más Boletines de VB aquí.

Ocurrió un error.

Cómo la IA híbrida de Anthrope podría remodelar la computación empresarial

Conozca el código Claude: el nuevo asistente de desarrollador de AI

De Pokémon a Enterprise: Probar la nueva inteligencia de AI

LEAVE A REPLY Cancel reply