
OpenAI está apostando válido por la IA del audio, y no se manejo solo de hacer que ChatGPT suene mejor. De acuerdo a nuevos informes Según The Information, la compañía ha unificado varios equipos de ingeniería, productos e investigación durante los últimos dos meses para revisar sus modelos de audio, todo en preparación para un dispositivo personal de audio que se aplazamiento divulgar en aproximadamente un año.
La medida refleja alrededor de dónde se dirige toda la industria tecnológica: alrededor de un futuro en el que las pantallas se convertirán en ruido de fondo y el audio ocupará un punto central. Los parlantes inteligentes ya han convertido a los asistentes de voz en un pájaro fijo en más de un tercero de hogares estadounidenses. meta solo lanzó una característica por sus anteojos inteligentes Ray-Ban que utilizan una matriz de cinco micrófonos para ayudarle a escuchar conversaciones en habitaciones ruidosas, esencialmente convirtiendo su rostro en un dispositivo de audición direccional. Mientras tanto, Google comenzó a constatar en junio con “Resúmenes de audio” que transforman los resultados de búsqueda en resúmenes conversacionales. Y Tesla está integrando Grok y otros LLM en sus vehículos para crear asistentes de voz conversacionales que puedan manejar todo, desde la navegación hasta el control del clima a través del diálogo natural.
No son sólo los gigantes tecnológicos los que hacen esta puesta. Ha surgido un heterogéneo agrupación de nuevas empresas con la misma convicción, aunque con distintos grados de éxito. Los creadores del Humane AI Pin quemaron cientos de millones antaño de que su dispositivo portátil sin pantalla se convirtiera en un descripción con moraleja. El colgante Friend AI, un collar que afirma que registrará su vida y ofrecerá compañía, ha provocado preocupaciones sobre la privacidad y temor existencial en medida igual. Y ahora al menos dos empresas, entre ellas Cárcel de arena y uno dirigido por el fundador de Pebble Eric Migicovskyestán construyendo anillos de IA que se aplazamiento que debuten en 2026, lo que permitirá a los usuarios charlar textualmente con la mano.
Los factores de forma pueden dilatar, pero la teoría es la misma: el audio es la interfaz del futuro. Cada espacio (su casa, su automóvil, incluso su cara) se está convirtiendo en una superficie de control.
Según se informa, el nuevo maniquí de audio de OpenAI, programado para principios de 2026, sonará más natural, manejará las interrupciones como un interlocutor vivo e incluso hablará mientras palabra, poco que los modelos actuales no pueden ganar. Igualmente se dice que la compañía imagina una grupo de dispositivos, que posiblemente incluyan anteojos o parlantes inteligentes sin pantalla, que actúen menos como herramientas y más como compañeros.
Falta de esto es muy sorprendente. The Information señala que el exjefe de diseño de Apple, Jony Ive, quien se unió a los esfuerzos de hardware de OpenAI a través de la empresa Adquisición de 6.500 millones de dólares en mayo de su firma io, ha hecho de la reducción de la yuxtaposición a los dispositivos una prioridad, viendo el diseño de audio primero como una oportunidad para “corregir los errores” de los dispositivos de consumo del pasado.
Adivinar más Tech News in Spanish