|
Inconvenientes con la sintetizacion de Voz .
La tecnología de reconocimiento de la generación de voz artificial consigue
voces muy reales que simulan emociones y se acercan cada vez más a la forma de
hablar humana y permiten la personalización, pudiendo elegir tanto el género,
como el acento o la velocidad del habla de la voz sintética.

Un tema a tener en cuenta en la comunicación hombre-máquina es el diseño del
interfaz, el cual debe ser amigable y natural (adaptado a la forma de actuar de
las personas) Para ello se estudia, como un paso posterior al
reconocimiento de voz, la
gestión inteligente del diálogo, un área de la inteligencia artificial que trata
hacer natural la conversación entre el hombre y la máquina, extrayendo
información mediante análisis sintáctico y semántico y relacionando el contexto
de la conversación.
Además, el sistema debe ser capaz de adaptarse a diversos usuarios en función de
su nivel de conocimiento del sistema en sí mismo, de sus preferencias
anteriores, o del contexto en el que se encuentre. También se trata de imitar
algunos fenómenos típicamente humanos: confirmaciones durante la conversación,
inicio de conversación menos fluido, etc. Cabe destacar que, los diálogos entre
humanos son variables con interrupciones frecuentes, solapamientos o frases
incompletas o no estructuradas correctamente. La interacción con la máquina debe
ser estructurada para que los objetivos del gestor de diálogo se realicen
correctamente.
La síntesis del habla tiene grandes ventajas para el usuario, ya que el proceso
de entrenamiento del sistema se hace más fácil y existe una menor posibilidad de
errores en el momento de dar una orden. En contraparte, es importante conocer
las siguientes desventajas, con fines que de usted pueda tomar una buena
decisión al adquirir equipos de reconocimiento de voz:
-
Falta de naturalidad y timbre robótico.
-
Los CTV o Conversores de Texto-Voz) generalmente producen
voz de hombre. Hay varias razones que pueden explicar este hecho: Hasta hace
relativamente poco tiempo, las personas que trabajaban en los laboratorios
eran hombres y éstos empleaban su propia voz durante los experimentos.
La voz masculina es ofrece mejor calidad que la femenina,
debido a que la frecuencia fundamental (primer armónico) de la mujer es mucho
más alta que la de hombre. La forma de onda en la voz de mujer tiene un
componente de oscilación no periódico, debido a una mayor frecuencia en la
aspiración y excitación glotal que es difícil de modelar. En los últimos
tiempos han aparecido sintetizadores que utilizan voz de mujer de calidad
aceptable, sin embargo, siguen sin alcanzar la calidad ofrecida por un
sintetizador de similares características que emplee voz masculina. [ Equipo
arquitectura y construcción de
ARQHYS.com ].
|