
DeepL, una empresa de traducción mejor conocida por sus herramientas de texto, lanzó hoy un paquete de traducción de voz a voz que cubre casos de uso como reuniones, conversaciones móviles y web, y conversaciones grupales para trabajadores de primera columna a través de aplicaciones personalizadas. La compañía igualmente está lanzando una API que permite a los desarrolladores y empresas externos explotar la tecnología de DeepL para casos de uso personalizados, como centros de llamadas.
“Posteriormente de acontecer tantos abriles en la traducción de textos, la voz fue un paso natural para nosotros”, dijo el director ejecutor de DeepL, Jarek Kutylowski, a TechCrunch en una entrevista. “Hemos itinerario un dilatado camino en lo que respecta a la traducción de textos y documentos. Pero pensábamos que no había un gran producto para la traducción de voz en tiempo positivo”.
Kutylowski dijo que los desafíos en la creación de un producto de traducción en tiempo positivo se centran en conquistar un compensación entre ceñir la latencia (el retraso entre algún que acento y la reproducción del audio traducido) y sustentar resultados precisos.
DeepL está lanzando complementos para plataformas como Teleobjetivo y Microsoft Teams, donde los oyentes pueden escuchar la traducción en tiempo positivo mientras otros hablan en su idioma nativo o seguir el texto traducido en tiempo positivo en la pantalla. Este software se encuentra actualmente en golpe temprano y la compañía está invitando organizaciones para unirse a una directorio de demora. La empresa igualmente cuenta con un producto para conversaciones móviles y basadas en la web que pueden realizarse en persona o de forma remota.
DeepL igualmente permite a los usuarios participar en una conversación grupal en entornos como sesiones de capacitación o talleres, permitiendo a los participantes unirse a través de un código QR.
DeepL dijo que su tecnología de voz a voz igualmente puede instruirse y adaptarse a vocabulario personalizado, como términos específicos de la industria y nombres personales y de empresas.
Kutylowski dijo que la IA está reinventando cómo será el servicio al cliente en los próximos abriles. Señaló que una capa de traducción ayuda a las empresas a alabar soporte en idiomas donde el personal calificado es escaso y costoso de contratar.
Evento tecnológico
San Francisco, California
|
13-15 de octubre de 2026
La compañía dijo que controla toda la pila de voz a voz. Sin secuestro, el sistema flagrante convierte la voz en texto, aplica la traducción y luego la convierte nuevamente en voz. DeepL cree que, cubo que ha trabajado en la traducción de textos durante abriles, tiene una preeminencia en la calidad de la traducción. En el futuro, la empresa quiere desarrollar un maniquí de traducción de voz de un extremo a otro que omita por completo el paso del texto.
DeepL se enfrenta a la competencia de varias nuevas empresas correctamente financiadas que trabajan en rincones adyacentes del espacio. Sanas, que el año pasado recaudó $65 millones de Quadrille Renta y Teleperformance, utiliza inteligencia sintético para modificar el acento de un hablante en tiempo positivo, una útil dirigida principalmente a agentes de centros de llamadas.
Camb.AI, con sede en Dubai, se centra en la síntesis de voz y la traducción para empresas de medios y entretenimiento Amazon Web Services, ayudándolas doblar y ubicar contenido de vídeo a escalera.
Palabra, respaldada por la firma Seven Seven Six del cofundador de Reddit, Alexis Ohanian, está construyendo un motor de traducción de voz en tiempo positivo diseñado para preservar tanto el significado como la voz flamante del hablantelo que lo pone en competencia más directa con lo que DeepL está construyendo ahora.
Descifrar más Tech News in Spanish
