|
VoiceNetSistema de automatización de bases de voz e investigaciones momentáneas de grabaciones con voz, el primero en Rusia
Medalla y diploma de primer lugar en el Foro internacional “Tecnologías de seguridad”
Destino y aplicaciones
- Administración de bases de voz locales (o regionales) y centralizadas para los órganos estatales que ejecutan investigaciones en el marco de causas penales.
- Identificación operativa de delincuentes y personas involucradas en perpetración de un delito
Capacidades funcionales
- Introducción y almacenamiento en la base de datos (fonoteca1) de grabaciones con voz de delincuentes y personas sospechadas en perpetración de un delito, incluso la información adicional: fotografías, datos indicadores y otra información textual que caracteriza a la persona o circunstancias en las que se registró la grabación.
- Entrada y almacenamiento en la fonoteca de grabaciones de voz de delincuentes desconocidos o personas relacionadas con el delito, incluso la información adicional: fotografías, datos indicadores y otra información textual que caracteriza a la persona o circunstancias en las que se registró la grabación.
- Eliminación automática de ruidos, compensación de distorsiones aportadas al canal de transferencia y grabación
- Estructurización de la base de datos: creación de la cantidad no limitada de fonotecas; redacción de la forma para introducir datos (márgenes de la ficha de registro) conforme a la utilización específica, exigencias de la legislación local (nacional, federal).
- Utilización de modelos listos de la forma para introducir datos.
- Extracción automática de características biométricas en grabaciones de voz utilizando tres métodos independientes.
- Búsquedas automáticas de diferentes tipos:
- de un “conocido2 entre otros conocidos” (exclusión de la posibilidad de registro bajo nombre falso o bajo datos indicadores falsos)
- de un “desconocido entre conocidos” o al revés (identificación de un delincuente desconocido o comprobación de relación con el delito del sospechado cuya persona ya está identificada)
- de un “desconocido entre desconocidos” (determinación de relación de una persona desconocida con unos delitos).
- Cálculo de valores de EER3 a base de los resultados de cada búsqueda.
- Introducción de datos a distancia, acceso distante a las fonotecas, construcción de sistemas distribuídos.
- Protección de datos biométricos contra su utilización no autorizada y modificación utilizando la firma digital.
- Delimitación flexible del acceso a recursos del sistema, protección de datos biométricos al transferirlos por canales de comunicaciones.
- Posibilidad de la investigación pericial posterior de grabaciones de voz seleccionadas como resultado de la búsqueda utilizando IKAR Lab.
Particularidades
- Alto nivel de automatización
En el VoiceNET los procesos tecnológicos de procesamiento y análisis de grabaciones de voz están automatizados al máximo. En caso que el régimen automático no permite considerablemente ganar el tiempo, así como si existe la necesidad de control severo de la operación por parte del operador, está previsto el régimen manual de trabajo (por ejemplo, al segmentar grabaciones).
- Posibilidad de operar con grabaciones de baja calidad
El filtrado de ruidos automático incorporado y corrección de la característica de amplitud y frecuencia amplian de modo importante las posibilidades del VoiceNET al operar con grabaciones de baja calidad incluso hechas en el canal de teléfono o de radio.
- Alta fiabilidad de búsqueda
La aplicación simultánea de tres métodos de extracción y comparación de características biométricas, que no dependen del idioma ni del texto, asegura alta fiabilidad de la búsqueda (en comparación con otros sistemas parecidos):
- Método espectral de formantes, protegido por patente.
- Método de estadísticas de la frecuencia fundamental.
- Método de modelos de voz.
- Ŕadaptabilidad a las condiciones de trabajo del cliente, configuraciones flexibles
Los márgenes de la ficha de registro pueden ser modificados por el mismo usuario conforme a la legislación nacional o reglas departamentales.
- Protección segura de información biométrica
La utilización de métodos modernos de digitalización, firma digital, así como la delimitación de derechos de acceso garantizan la protección de datos biométricos contra robos y modificación no autorizada.
- Escalabilidad
El sistema no está limitado en principio por el volumen de información almacenada ni por la cantidad de usuarios. Las capacidades del sistema en función pueden ser ampliadas con relativa facilidad a cuenta de utilizar medios calculadores más productivos, adicionar lugares de trabajo de operadores, crear nuevas fonotecas.
- Compatibilidad informativa El sistema opera prácticamente con cualesquier formatos de archivos de audio utilizando las codificaciones instaladas en el sistema operativo. Es importante para el sistema que en el archivo de audio se conserven las características biométricas. Para intercambiar de información entre los elementos del sistema se utilizan los canales tipo estándar Ethernet y VPN protegida (Virtual Private Network).
- Enfoque integral
El sistema permite realizar tanto la búsqueda como la investigación criminalística (pericial) posterior de grabaciones de voz en pleno volumen para la presentación posterior de sus resultados ante el tribunal
Fuentes principales del abastecimiento de la fonoteca
- Grabaciones hechas en el proceso de actos de operaciones de detección.
- Grabaciones de actos de instrucción (audio protocolos de interrogatorios, confrontaciones etc.).
- Grabaciones de mensajes telefónicos a los servicios de policía y socorro extraordinario.
- Grabaciones presentadas por víctimas.
- Muestras de voz especialmente sacadas a delincuentes o sospechados en perpetración de un crimen para su registro e investigación pericial posterior.
Orden de trabajo
Las grabaciones enroladas previamente con la información adjunta llegan a los operadores en forma de archivo de audio (en portadores materiales o por canales de comunicaciones).
El operador escucha las grabaciones llegadas y si es necesario las somete al procesamiento preliminar en el régimen automático o manual:
- segmentación de la señal según la pertenencia a diferentes locutores
- eliminación de señales no vocales y grandes pausas en el habla que pueden influir negativamente a la fiabilidad de búsqueda
- filtrado de ruidos y aumento de claridad del habla en grabaciones de baja calidad.
Después, el operador llena la ficha de registro (véase el dib.), introduce en ella la información gráfica y textual adicional: sobre la persona, condiciones de registro, cuerpo del delito. La información sobre la fecha de creación de ficha y su autor (operador) se introduce en la ficha automáticamente.
Después, que la grabación o muestra ha sido introducida por el operador, se extraen automáticamente los parámetros de identificación (biométricos), que se almacenan con la ficha de registro en la fonoteca indicada por el operador. Cada ficha con la información biométrica está protegida contra la modificación (falsificación) por firma digital.
Si es necesario, el operador puede encomendar la tarea de buscar a las personas cuyas características biométricas coinciden o son parecidos a los que se contienen en nueva o cualquier otra ficha de la fonoteca. La propia búsqueda consiste en comparar por parejas características biométricas de la ficha indicada por el operador con las de otras fichas de la fonoteca o de su parte extraída previamente por el operador.
Resultados de trabajo
A base de los resultados de la búsqueda, VoiceNET redacta un informe textual que se lleva a conocimiento del operador (véase el dib.). Todas las tareas de búsqueda y resultados de búsqueda se conservan en la memoria del sistema en forma de archivos textuales. Para utilizar los resultados obtenidos de búsqueda en calidad de prueba ante el tribunal, se efectúa la investigación criminalística pericial utilizando IKAR Lab.
Características principales:
Rapidez de funcionamiento
La rapidez de funcionamiento se determina por el tiempo tardado en extraer características de identificación, así como por la cantidad de comparaciones por parejas que se efectúan por una unidad de tiempo En un PC de 8 núcleos en una hora se puede efectuar la búsqueda entre 26 mil de grabaciones.
Fiabilidad de búsqueda
La fiabilidad de búsqueda se caracteriza por el valor de EER (EER – Equal Error Rates), o sea por el nivel de error igual (punto de coincidencia de probabilidades FRR y FAR, o sea errores del primero y segundo orden).
EER depende principalmente de la calidad (relación señal/ruido, irregularidad de la característica de frecuencia, zona de omisión, distorsiones eléctricas y acústicas etc.) y duración de la señal, comparabilidad del estado físico y emocional del hablante en el momento de grabación.
Al testear VoiceNET en la base de audio RUSTEN oficialmente registrada se obtuvieron los resultados siguientes:
Para diferentes métodos de extracción y comparación de características biométricas el valor mínimo (el mejor) de EER constituyó el 4.1% al comparar parejas de señales de voz de 20 seg de duración, y el valor máximo (el peor) de EER constituyó el 20% al comparar señales de voz de 10 seg de duración
Requerimientos a la señal
Para lograr los parámetros declarados de fiabilidad de búsqueda, la señal acústica (de grabaciones con voz) debe satisfacer a los requerimientos siguientes:
- duración de la muestra pura - no menos de 16 seg
- relación señal/ruido en el diapasón de frecuencia de 300…3400 Hz – no menos de 12 dB
- irregularidad de característica de frecuencia en el diapasón de frecuencia de 300…3400 Hz – no más de 15 dB
- ausencia de distorsiones acústicas en forma de reverberación o eco
- ausencia de fenómenos de detonación (para las grabaciones análogas)
- presencia de mínimo tres formantes en la señal
Componentes del complejo tipo
El complejo comprende dos o más ordenadores personales unidos en una red, con el Software instalado que opera en el régimen cliente-servidor:
- Server – Software necesario para asegurar el almacenamiento y utilización de “fichas de locutores” en el marco del Complejo y efectuar la búsqueda por demandas de los usuarios.
- Formebuilder (por opción) – Software para crear fonotecas (bases de datos), registrar a los usuarios del Complejo y dirigirles, así como para determinar la estructura de fonoteca.
- Operator – Software para crear, examinar y redactar partes de la fonoteca, para adicionar “fichas de locutores” y operar con ellas, incluso Software para segmentar y preparar la señal.
1La fonoteca se representa una base de datos ordenada, así como instrumentos para su llenado, búsqueda y comparación por orden del operador.
2“Conocido” es una persona cuya identidad está determinada o se conoce
3 EER (Equal Error Rates) – nivel de error igual, o sea punto de coincidencia de probabilidades de errores del primero (omisión del fin) y segundo orden.
|