cross_field_consistency_checker
Compara los datos extraídos de la MRZ con los datos de la zona de lectura visual (VIZ) del documento. Las discrepancias detectan documentos manipulados donde se ha modificado solo una zona.
When to use
Usar después de obtener resultados de paddleocr y mrz_parser para validar coherencia.
Instructions
- Normalizar campos antes de comparar: quitar acentos, convertir a mayúsculas, limpiar caracteres especiales.
- Comparar:
document_number_mrzvsdocument_number_viz. - Comparar:
birth_date_mrzvsbirth_date_viz(normalizar formato de fecha). - Comparar:
expiry_date_mrzvsexpiry_date_viz. - Comparar:
name_mrzvsname_viz(usar distancia de Levenshtein para tolerancia a errores OCR; umbral ≤2). - Calcular score de consistencia:
n_matching / n_total_fields. - Si score < 0.7: emitir flag
DOCUMENT_INCONSISTENCYalantifraud_agent. - Documentar qué campos divergen en el evento de auditoría.
Notes
- Distancia de Levenshtein:
pip install python-Levenshtein. - Pequeñas diferencias pueden ser errores OCR; el contexto de múltiples discrepancias es lo relevante.