Finalmente una instalación de audio que no absorbe

Empezamos a las 21mi Un siglo durante dos décadas, coches Literalmente empiezas a volar, las vacaciones espaciales están cerca … Sin embargo, las computadoras todavía parecen una parodia de robots confusos cuando se les pide que conviertan texto a voz (TTS). Vamos desarrolladores, debe haber una forma mejor.

empresa llamada WellSaid Labs Ella cree que tiene uno y recibe un impulso de Serie A.

“En pocas palabras, WellSaid es el futuro de la creación de contenido de audio. Es por eso que a miles de clientes les encanta usar el producto a diario, con una adopción de abajo hacia arriba incomparable. El socio general de FUSE, que dirigió la gira, dijo que Matt recopiló Y Michael es un equipo de clase mundial, y no podríamos estar más emocionados de ser parte del viaje de WellSaid “.

Vayamos al punto correcto: puedes escuchar Muestras de audio aquí.

Una gran cantidad de muestras de audio

Este es uno de los mayores desafíos de la inteligencia artificial y un tema de investigación importante en áreas como la informática, la interfaz hombre-máquina y la robótica. En junio de 2020, según un comunicado, WellSaid Labs Text-to-Speech se convirtió en el primero en lograr la paridad humana-naturaleza, en clips de audio cortos, a través de múltiples voces.

“Hemos agregado AI Voice al conjunto de herramientas de miles de creadores de contenido y sus equipos”, dice Matt Hawking, director ejecutivo de WellSaid Labs. “Human Equivalence AI Voice se puede producir en tiempo real y actualizar a pedido. Desbloqueando nuevas y emocionantes oportunidades para ‘agregar voz’ que antes no era posible. AI Voice garantiza que cada producción se cree fácilmente y se actualice de manera eficiente a escala”.

READ  Samsung lanzó una aplicación para ver televisión en vivo desde su teléfono inteligente

La etapa de paridad humana tiene implicaciones importantes sobre cómo se crea el contenido de audio, lo que ha llevado a los inversores a unirse. Los casos de uso incluyen servicios de radiodifusión y radio, publicidad programática, marketing digital y contenido de formación corporativa. WellSaid Labs tiene una biblioteca de glifos de audio que brindan acceso a muchos estilos y tonos de lectura. Además, las marcas pueden crear avatares de audio con tecnología de inteligencia artificial para capturar la similitud, el estilo y la singularidad del audio necesario para contar sus historias.

“Los creadores de contenido o los diseñadores de experiencias de productos se han enfrentado anteriormente a compromisos difíciles entre calidad y escalabilidad al utilizar herramientas de conversión de texto a voz o locución humana. Las impresionantes voces de WellSaid, accesibles a través de una aplicación de estudio o API escalable, eliminan la necesidad de elegir entre realistas , sonido natural y contenido de audio fácilmente escalable, dice James Newell de Voyager Capital, “WellSaid ofrece ambos y los entrega de la manera en que su equipo quiere que se consuman”. En horas en lugar de semanas. “

Fuente : ZDNet.com

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *