La tecnología de voz a texto de CyberDataControl

El reconocimiento de voz a texto es una tecnología de reconocimiento de voz desarrollada sobre la base de los modernos métodos de aprendizaje por máquina. La tecnología permite convertir el flujo de audio en texto en tiempo real. 

Características principales 

  • Orador Independiente
  • Reconocimiento del discurso conjunto 
  • Precisión de reconocimiento - hasta el 84%
  • Personalización de un tema determinado
  • Trabajo fuera de línea
  • Diccionario - 500 mil palabras

Reconocimiento del voz

El servicio permite la autenticación de tres factores

  • disponibilidad del teléfono registrado 
  • la voz coincide con la de los demás 
  • sincronizar con el texto enviado 

Se basa en una tecnología original que permite

  • reducir el tamaño de la muestra de voz a cinco segundos
  • Superar una solución similar de una compañía internacional en un conjunto de datos estándar de la base de datos MOBIO
  • ejecutar todo en la CPU 

Reconocimiento de audio

Un dispositivo móvil o un dispositivo de baja potencia puede reconocer un conjunto de eventos sonoros predefinidos.

Se ha implementado un módulo de identificación de eventos de audio

  • el llanto de un bebé
  • ladridos de un perro
  • rotura de vidrios
  • disparos
  • alarma de fuego

Posible uso

  • Sistemas de seguridad y alarma
  • Implementación de un escenario específico basado en un evento de audio (encendido de cámaras de vídeo, encendido de luces, envío de alertas, inicialización de diagnósticos del estado del equipo)

Exactamente

  • Llanto de niños - 96%
  • Ladridos de perro - 94%
  • Rotura de cristal - 92%
  • Sonido de fuego/detector de humo - 98%

Diarización

Determining whether the replicas belong to the system is an important component of speech recognition.
Correct diarrhea allows you to better adapt to the peculiarities of pronunciation and accent and qualitatively divide the statements of different people. The technology will find application, in particular, in creating subtitles for video recordings.
Properly recognized speech is easier to translate into other languages, which, for example, will be useful for online training courses.
And the ability to process sounds in real time will allow you to do so even live.
Utilizamos cookies
Preferencias de las cookies
A continuación, encontrará información sobre los propósitos para los cuales nosotros y nuestros socios utilizamos cookies y procesamos datos. Puede establecer sus preferencias para el procesamiento y/o consultar más información en los sitios web de nuestros socios.
Cookies analíticas Desactivar todo
Cookies funcionales
Otras cookies
Utilizamos cookies para personalizar el contenido y los anuncios, proporcionar las funciones que utilizan las redes sociales y analizar nuestro tráfico. Obtener más información sobre nuestra política de cookies.
Cambiar las preferencias Aceptar todo
Cookies