|
Sintetizadores de Voz .
La voz sintética es una voz artificial (no pregrabada), generada mediante un
proceso de sintetización del habla. Y la síntesis de habla es la producción
artificial del habla humana. El sistema usado con este propósito recibe el
nombre de sintetizador de habla y puede llevarse a cabo a través de un
software o de un hardware.
La síntesis de voz se llama a menudo en inglés text-to-speech (TTS), en
referencia a su capacidad de convertir texto en habla. Sin embargo, hay sistemas
que en lugar de producir voz a partir de texto lo hacen a partir de
representación lingüística simbólica en habla.
La calidad de una voz sintética vendrá dada por la naturalidad e
inteligibilidad. La naturalidad de un sintetizador de voz se refiere a hasta qué
punto suena como la voz de una persona real. La inteligibilidad de un
sintetizador se refiere a la facilidad de la salida de poder ser entendida.
Existen dos tecnologías principales usadas para generar habla sintética:
-
Síntesis concatenativa: Se basa en la concatenación de
segmentos grabados de voz. Generalmente, la síntesis concatenativa produce
resultados más naturales, sin embargo, la variación natural del habla y las
técnicas automatizadas de segmentación de formas de onda resultan en
defectos audibles, que conllevan una pérdida de naturalidad.
-
Síntesis de formantes: No usa muestras de habla humana en
tiempo de ejecución. La salida se crea usando un modelo acústico; y los
parámetros como la frecuencia fundamental y los niveles de ruido se varían
durante el tiempo para crear una forma de onda o habla artificial. Muchos
sistemas basados en síntesis de formantes generan habla robótica y de
apariencia artificial, y la salida nunca se podría confundir con la voz
humana. Sin embargo, la naturalidad máxima no es siempre la meta de un
sintetizador de voz, y estos sistemas tienen algunas ventajas sobre los
sistemas concatenativos: La síntesis de formantes puede ser muy inteligible,
incluso a altas velocidades (a menudo usada por los discapacitados visuales
para utilizar computadores con fluidez), evitando los defectos acústicos que
pueden aparecer con frecuencia en los sistemas concatenativos.
Por otra parte, los sintetizadores de formantes son a menudo
programas más pequeños que los sistemas concatenativos porque no necesitan una
base de datos de muestras de voz grabada, de esta forma, pueden usarse en
sistemas empotrados, donde la memoria y la capacidad de proceso son exiguas. Por
último, dado que los sistemas basados en formantes tienen un control total sobre
todos los aspectos del habla producida, pueden incorporar una amplia variedad de
tipos de entonaciones, que no sólo comprendan preguntas y enunciaciones.[ Equipo
arquitectura y construcción de
ARQHYS.com ].
|