La tecnología de voz a texto de CyberDataControl
El reconocimiento de voz a texto es una tecnología de reconocimiento de voz desarrollada sobre la base de los modernos métodos de aprendizaje por máquina.
La tecnología permite convertir el flujo de audio en texto en tiempo real.
Características principales
- Orador Independiente
- Reconocimiento del discurso conjunto
- Precisión de reconocimiento - hasta el 84%
- Personalización de un tema determinado
- Trabajo fuera de línea
- Diccionario - 500 mil palabras
Reconocimiento del voz
El servicio permite la autenticación de tres factores
- disponibilidad del teléfono registrado
- la voz coincide con la de los demás
- sincronizar con el texto enviado
Se basa en una tecnología original que permite
- reducir el tamaño de la muestra de voz a cinco segundos
- Superar una solución similar de una compañía internacional en un conjunto de datos estándar de la base de datos MOBIO
- ejecutar todo en la CPU
Reconocimiento de audio
Un dispositivo móvil o un dispositivo de baja potencia puede reconocer un conjunto de eventos sonoros predefinidos.
Se ha implementado un módulo de identificación de eventos de audio
- el llanto de un bebé
- ladridos de un perro
- rotura de vidrios
- disparos
- alarma de fuego
Posible uso
- Sistemas de seguridad y alarma
- Implementación de un escenario específico basado en un evento de audio (encendido de cámaras de vídeo, encendido de luces, envío de alertas, inicialización de diagnósticos del estado del equipo)
Exactamente
- Llanto de niños - 96%
- Ladridos de perro - 94%
- Rotura de cristal - 92%
- Sonido de fuego/detector de humo - 98%
Diarización