A pesar de sus 31 días, diciembre es un mes corto. Es difícil que los anuncios y acontecimientos que no sean fiestas de oficina llamen la atención. Para contender contra esta tendencia, OpenAI hizo una serie de anuncios: sus “12 días de OpenAI”. Para no decidir eclipsado, Google respondió con una avalancha de anuncios, incluido su maniquí Gemini 2.0 Flash Thinking. Aparecieron modelos que podían utilizar la transmisión de audio y vídeo tanto para entrada como para salida. Pero quizás el anuncio más importante fue DeepSeek-V3, un maniquí muy excelso con una combinación de expertos (parámetros 671B) que tiene un rendimiento a la par de los otros modelos superiores, pero su entrenamiento cuesta aproximadamente una décima parte.
AI
- DeepSeek-V3 es otro LLM a seguir. Su rendimiento está a la par de Pasión 3.1, GPT-4o y Claude Sonnet. Si correctamente la formación no era baratura, la costo de entrenamiento Se estimó que era aproximadamente el 10% de los modelos más grandes.
- Para no quedarse a espaldas Google, OpenAI paisaje previa sus próximos modelos: o3 y o3-mini. Uno y otro son “modelos de razonamiento” que han sido entrenados para resolver problemas lógicos. Es posible que sean liberados a finales de enero; OpenAI está buscando investigadores de seguridad y protección para pruebas.
- Para no quedarse a espaldas con los 12 días de OpenAI, Google ha resuelto un nuevo maniquí práctico que ha sido entrenado para resolver problemas lógicos: Pensamiento flash Géminis 2.0. A diferencia de los modelos GPT de OpenAI que apoyan el razonamiento, Flash Thinking muestra su sujeción de pensamiento explícitamente.
- Jeremy Howard y su equipo tienen resuelto ModernBERTun importante restablecimiento al maniquí BERT que lanzaron hace seis abriles. Viene en dos tamaños: parámetros 139M y 395M. Es ideal para la recuperación, clasificación y ascendencia de entidades, y otros componentes de una canalización de datos.
- El servicio Bedrock de AWS tiene la capacidad de comprobar la salida de otros modelos por alucinaciones.
- Para comprobar de que los 12 días de OpenAI no los superen, Google ha anunciado Android XRun sistema operante para lentes y cascos de sinceridad extendida. Google no planea construir su propio hardware; se están asociando con Samsung, Qualcomm y otros fabricantes.
- Anthropic siquiera se quedará a espaldas con los 12 días de OpenAI clioun enfoque que preserva la privacidad para descubrir cómo la gentío usa sus modelos. Esa información se utilizará para mejorar la comprensión de Anthropic sobre los problemas de seguridad y para construir modelos más bártulos.
- Para no quedarse a espaldas tras los 12 días de OpenAI, Google ha anunciado Gemini 2.0 Flash, un maniquí multimodal que admite streaming tanto para entrada como para salida. El anuncio asimismo mostró Astraun agente de IA para teléfonos inteligentes. Ningún de los dos está apto en genérico todavía.
- OpenAI ha resuelto sábanauna nueva característica que combina la programación con la escritura. Los cambios en el sábana (código o texto) inmediatamente pasan a formar parte del contexto. El código Python se ejecuta en el navegador usando Pyodide (Wasm), en oficio de en un contenedor (como con Code Interpreter).
- La guión tiene anunciado un kit de herramientas del agente que le permite incorporar pagos en flujos de trabajo agentes. Stripe recomienda utilizar el kit de herramientas en modo de prueba hasta que la aplicación haya sido validada completamente.
- Simón Willison muestra cómo ejecutar un maniquí de clase GPT-4 (Pasión 3.3 70B) en una computadora portátil razonablemente correctamente equipada (MacBook Pro M2 de 64 GB).
- Como parte de su serie 12 días de OpenAI, OpenAI finalmente lanzó su maniquí de gestación de video. sora. Es infundado para los suscriptores de ChatGPT Plus, aunque está pequeño a 50 videoclips de cinco segundos por mes; una cuenta ChatGPT Pro relaja muchas de las limitaciones.
- Los investigadores han demostrado que los modelos avanzados de IA, incluidos Claude 3 Opus y OpenAI o1, son capaces de “intrigante”: trabajar en contra de los intereses de sus usuarios para ganar sus objetivos. La intriga incluye trastornar los mecanismos de supervisión, ofrecer intencionalmente resultados deficientes e incluso tomar medidas para evitar el falleba o el reemplazo. Hola HAL?
- trapo itinerante es una nueva técnica de recuperación de gestación aumentada que encuentra contenido relevante buscando entre títulos para navegar por los documentos, como lo haría un ser humano. Requiere documentos correctamente estructurados. Una idea sorprendentemente simple, de verdad.
- Google ha anunciado paligemma 2una nueva traducción de sus modelos Gemma que incorpora visión.
- GPT-4-o1-preview ya no existe; la paisaje previa ahora es actual, AbiertoAI o1. Por otra parte de las habilidades de razonamiento avanzadas, la traducción de producción pretende ser más rápida y ofrecer resultados más consistentes.
- Un clase de agentes de IA en minecraft se comportaron sorprendentemente como humanos—Incluso desarrollando empleos y religiones. ¿Es esta una forma de modelar cómo colaboran los grupos humanos?
- Una cosa que la industria de la IA necesita desesperadamente (diferente de más potencia) es mejores puntos de remisión. Los puntos de remisión actuales son cerrados, fáciles de manipular (eso es lo que hace la IA) e irreproducibles, y es posible que no prueben nulo significativo. Mejor tira es un entorno para evaluar la calidad de remisión.
- Palmyra Creative, el nuevo maniquí de verbo de Writerpromete la capacidad de desarrollar “estilo” para que todos los resultados generados por IA no suenen aburridos y iguales.
- Durante el entrenamiento, la IA detecta sesgos de los datos humanos. Cuando los humanos interactúan con la IA, hay una onda de feedback eso amplifica esos sesgos.
Programación
- Unicón Puede que nunca se convierta en uno de los 20 principales (o 100 principales) lenguajes de programación, pero es descendiente de Iconoque siempre fue mi verbo preferido para el procesamiento de cadenas.
- ¿Qué significan los CAPTCHA? cuando los robots equipados con LLM pueden completar con éxito tareas establecidas para humanos?
- eguiinmediato con entorno electrónicoes una biblioteca GUI y un entorno para Rust. Es portátil y se ejecuta de forma nativa (en macOS, Windows, Linux y Android), en la web (usando Wasm) y en muchos motores de juegos.
- Para el archivero que hay en nosotros: El de la isla de Man El tesina no se proxenetismo de una isla en el Mar de Irlanda ni de gatos. Es un catálogo de manuales para computadoras antiguas.
- Cerbrec es un Python boceto entorno para el estudios profundo. Está dirigido a programadores de Python que no tienen la experiencia suficiente para crear aplicaciones con PyTorch u otras bibliotecas de IA.
- GitHub tiene anunciado paso tirado a GitHub Copilot para todos los usuarios actuales y nuevos. El paso tirado le permite completar 2000 códigos y 50 mensajes de chat por mes. Además agregaron la capacidad de usar Claude 3.5 Sonnet adicionalmente de GPT-4o.
- devinla útil de codificación asistida por IA que pretende respaldar el progreso de software de principio a fin, incluido el diseño y la depuración, ha cogido disponibilidad genérico.
- JSON5, asimismo conocido como “JSON para humanos”, es una modificación de JSON que ha sido diseñada para que sea inteligible por humanos, de modo que pueda escribirse y mantenerse a mano, por ejemplo, en archivos de configuración.
- AWS tiene anunciado dos nuevos servicios importantes: aurora dsqlque es una cojín de datos SQL distribuida, y Tablas S3que admite lagos de datos a través de Apache Iceberg.
- flujo necesario es una útil de código despejado para crear un boceto de conocimiento. Está basado en TiDB (una cojín de datos vectorial), LlamaIndex y DSPy.
Seguridad
- Portspoof es una útil de seguridad que hace que los 65.535 puertos TCP aparezcan abiertos para servicios válidos. Emula un servicio válido en cada puerto. A un atacante le resulta difícil determinar qué puertos están efectivamente abiertos sin probar cada puerto.
- Vamos a sintetizarque emite los certificados que los sitios web (y otras aplicaciones) utilizan para demostrar sus identidades, ha anunciado certificados de corta duración que caducan a los seis días. Los certificados de corta duración aumentan la seguridad al minimizar la exposición si una esencia privada se ve comprometida.
- Oportuno a la presencia continua de atacantes en el interior de las redes de telecomunicaciones, el FBI y CISA de EE. UU. han recomendado el uso de protocolos de comunicación cifrados. (Aunque todavía quieren puertas traseras en los sistemas de oculto, lo que los haría vulnerables a los ataques).
- A nuevo ataque de phishing utiliza documentos de Word corruptos para eludir los controles de seguridad. Si correctamente los documentos están corruptos, Word puede recuperarlos.
- LLM Rompeflujos es una nueva clase de ataque contra modelos de verbo que evita que las barreras de seguridad impidan que resultados objetables lleguen al heredero. Estos ataques aprovechan las condiciones de carrera en la interacción de la aplicación con los usuarios.
- botita es un rootkit UEFI que apunta al puesta en marcha seguro en sistemas Ubuntu. Parece acaecer sido desarrollado por estudiantes de ciberseguridad en Corealuego se filtró (posiblemente accidentalmente). Aún no se ha opuesto en la naturaleza, pero cuando lo haga, será una amenaza peligrosa.
- DEF CON ha iniciado un tesina para mejorar la ciberseguridad de la infraestructura hídrica en los EE.UU. Están comenzando con seis compañías de agua que prestan servicios a comunidades rurales.
Computación cuántica
- Google tiene construido a chip de computación cuántica en el que un qubit natural con corrección de errores puede permanecer estable durante una hora. Pasa el “paso por debajo”: la tasa de error disminuye a medida que se agregan qubits físicos para la corrección de errores. El chip fue construido en las nuevas instalaciones de fabricación de Google.
Web
- Google está agregando “reseñas de tiendas”a Chrome. Las reseñas son resúmenes de informes generados por IA de fuentes conocidas que informan sobre estafas y otros problemas.
- Aquí hay un tutorial sobre creación de interfaces de heredero de transmisión de texto en la web. La transmisión de texto es casi una requisito para crear chatbots basados en inteligencia industrial.
Biología
- Sí, podemos tener un elegancia aparente. Un clase de investigación ha desarrollado un interfaz de paleta para que la gentío pueda sufrir el elegancia en mundos virtuales.