Finalmente una instalación de audio que no absorbe

Empezamos a las 21mi Un siglo durante dos décadas, coches Literalmente empiezas a volar, las vacaciones espaciales están cerca … Sin embargo, las computadoras todavía parecen una parodia de robots confusos cuando se les pide que conviertan texto a voz (TTS). Vamos desarrolladores, debe haber una forma mejor.

empresa llamada WellSaid Labs Ella cree que tiene uno y recibe un impulso de Serie A.

“En pocas palabras, WellSaid es el futuro de la creación de contenido de audio. Es por eso que a miles de clientes les encanta usar el producto a diario, con una adopción de abajo hacia arriba incomparable. El socio general de FUSE, que dirigió la gira, dijo que Matt recopiló Y Michael es un equipo de clase mundial, y no podríamos estar más emocionados de ser parte del viaje de WellSaid “.

Vayamos al punto correcto: puedes escuchar Muestras de audio aquí.

Una gran cantidad de muestras de audio

Este es uno de los mayores desafíos de la inteligencia artificial y un tema de investigación importante en áreas como la informática, la interfaz hombre-máquina y la robótica. En junio de 2020, según un comunicado, WellSaid Labs Text-to-Speech se convirtió en el primero en lograr la paridad humana-naturaleza, en clips de audio cortos, a través de múltiples voces.

“Hemos agregado AI Voice al conjunto de herramientas de miles de creadores de contenido y sus equipos”, dice Matt Hawking, director ejecutivo de WellSaid Labs. “Human Equivalence AI Voice se puede producir en tiempo real y actualizar a pedido. Desbloqueando nuevas y emocionantes oportunidades para ‘agregar voz’ que antes no era posible. AI Voice garantiza que cada producción se cree fácilmente y se actualice de manera eficiente a escala”.

READ  Call of Duty: Warzone obtiene un nuevo paquete de texturas en las series PS5 y Xbox

La etapa de paridad humana tiene implicaciones importantes sobre cómo se crea el contenido de audio, lo que ha llevado a los inversores a unirse. Los casos de uso incluyen servicios de radiodifusión y radio, publicidad programática, marketing digital y contenido de formación corporativa. WellSaid Labs tiene una biblioteca de glifos de audio que brindan acceso a muchos estilos y tonos de lectura. Además, las marcas pueden crear avatares de audio con tecnología de inteligencia artificial para capturar la similitud, el estilo y la singularidad del audio necesario para contar sus historias.

“Los creadores de contenido o los diseñadores de experiencias de productos se han enfrentado anteriormente a compromisos difíciles entre calidad y escalabilidad al utilizar herramientas de conversión de texto a voz o locución humana. Las impresionantes voces de WellSaid, accesibles a través de una aplicación de estudio o API escalable, eliminan la necesidad de elegir entre realistas , sonido natural y contenido de audio fácilmente escalable, dice James Newell de Voyager Capital, “WellSaid ofrece ambos y los entrega de la manera en que su equipo quiere que se consuman”. En horas en lugar de semanas. “

Fuente : ZDNet.com

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *