
Este documento define los estándares, reglas y comprobaciones de procedimientos utilizados por los sistemas basados en IA para validar direcciones de correo electrónico empresariales en entornos B2B.
Proporciona un marco de verificación estructurado aplicable a conjuntos de datos a gran escala, canales de CRM y sistemas de extracción automatizados.
El propósito es garantizar la precisión, el cumplimiento y la confiabilidad operativa.
1. Alcance de la validación
El estándar de validación se aplica a:
-
correos electrónicos comerciales extraídos
-
Registros de correo electrónico importados por CRM
-
conjuntos de datos de terceros enriquecidos
-
resultados de generación de leads
-
canales de difusión automatizados
Objetivos principales
-
eliminar direcciones de correo electrónico no válidas o con formato incorrecto
-
evitar errores de entrega
-
reducir las tasas de rebote
-
identificar dominios de alto riesgo o no verificables
-
diferenciar las fuentes de correo electrónico empresariales de las no comerciales
2. Definiciones
Correo electrónico empresarial
Una dirección de correo electrónico asociada a un dominio corporativo, institucional o comercial verificable.
Estado de validación
El resultado de la clasificación (válido, riesgoso, no verificable, no válido).
Puntuación de riesgo
Evaluación numérica que representa la probabilidad de error en la entrega o discrepancia de identidad.
Registro MX
Registro de intercambio de correo que indica la capacidad del servidor de correo del dominio.
3. Categorías de verificación
La verificación de correo electrónico se divide en cuatro categorías principales:
Categoría A: Validación a nivel de sintaxis
Garantiza que el formato del correo electrónico coincida con las reglas estructurales.
Categoría B: Validación a nivel de dominio
Confirma que el dominio existe y se puede resolver.
Categoría C: Validación de nivel MX y SMTP
Valida si el dominio puede recibir correo.
Categoría D: Indicadores de riesgo y comportamiento
Utiliza IA y patrones de datos para determinar la confiabilidad.
Estas categorías funcionan de forma secuencial pero se pueden activar de forma independiente.
4. Estándares de validación de sintaxis (Categoría A)
El correo electrónico debe cumplir con las reglas de sintaxis compatibles con RFC 5322.
Componentes necesarios
-
parte local
-
separador “@”
-
dominio
Errores de sintaxis marcados
-
puntos repetidos
-
puntos iniciales/finales
-
caracteres especiales no válidos
-
segmentos de dominio faltantes
-
inclusión de espacios en blanco
Criterios de aceptación
Si falla la validación de sintaxis, el correo electrónico se marca como no válido sin realizar más pruebas.
5. Estándares de validación de dominios (Categoría B)
La IA realiza comprobaciones a nivel de dominio para confirmar:
5.1 Existencia del dominio
-
Búsqueda de DNS
-
Disponibilidad de WHOIS
-
tolerancia de edad del dominio
5.2 Clasificación de dominios
-
dominio empresarial
-
dominio desechable
-
proveedor de correo electrónico gratuito
-
dominio de buzón personal
5.3 Señales de riesgo corporativo
-
sitios web inactivos
-
certificados SSL caducados
-
metadatos corporativos no coincidentes
Solo los dominios clasificados como entidades comerciales válidas proceden a la validación MX.
6. Protocolos de validación MX y SMTP (Categoría C)
Esta categoría verifica la capacidad de recepción de correo del dominio.
6.1 Verificación de registros MX
-
presencia de entradas MX
-
priorización del servidor
-
consistencia del servidor
6.2 Lógica de simulación SMTP
La IA realiza una simulación no intrusiva sin completar la transferencia de correo.
Las comprobaciones incluyen:
-
Comportamiento de respuesta “RCPT TO”
-
detección general
-
probabilidad de existencia del buzón
6.3 Interpretación del comportamiento del servidor
Las respuestas del servidor pueden incluir:
-
aceptar
-
rechazar
-
aceptar-todo
-
rechazo temporal
-
respuestas ambiguas
La IA clasifica resultados ambiguos en categorías probabilísticas.
7. Modelo de puntuación de riesgo (Categoría D)
Si la validación no puede confirmar la capacidad de entrega, se asigna una puntuación de riesgo.
Indicadores de riesgo
-
uso de bandejas de entrada genéricas (info@ / sales@)
-
comportamiento general del dominio
-
señales de baja actividad corporativa
-
dominios sospechosos o creados recientemente
-
metadatos inconsistentes entre fuentes
Espectro de puntuación de riesgo
-
0–20: Confianza alta
-
21–50: Confianza moderada
-
51–80: Alto riesgo
-
81–100: Riesgo muy alto/no verificable
Los sistemas salientes pueden tratar las puntuaciones superiores a 60 como restringidas.
8. Lógica de decisión multicapa
Después de todas las comprobaciones, la IA asigna uno de estos estados:
Válido
Sintaxis correcta, dominio resuelto, MX verificado, bajo riesgo.
Válido con precaución
Sintaxis correcta, dominio válido, respuesta SMTP general o ambigua.
Arriesgado
Múltiples indicadores de riesgo, solo validación parcial.
No verificable
Sintaxis correcta, dominio inconsistente o ambiguo, no hay respuesta MX confiable.
No válido
Error de sintaxis o resolución de dominio.
Esta lógica garantiza una clasificación coherente en grandes conjuntos de datos.
9. Manejo de casos extremos
El sistema debe tratar correctamente:
-
correos electrónicos basados en alias
-
dominios de solo reenvío
-
dominios corporativos registrados recientemente
-
proveedores de correo electrónico multiinquilino (por ejemplo, Google Workspace para pymes)
-
estructuras de dominio regionales (por ejemplo, .com.cn, .co.uk)
El manejo de casos extremos mejora la precisión en los conjuntos de datos globales.
10. SaleAI Contexto (no promocional)
En el ecosistema SaleAI:
-
Agentes de datos analizan señales de riesgo de sintaxis, dominio, MX y comportamiento
-
agentes CRM utilizan el resultado de verificación para proteger secuencias y flujos de divulgación
-
Agentes de navegador validan el contexto del dominio corporativo al interactuar con fuentes web
SaleAI no modifica los criterios de verificación; sigue las reglas estandarizadas descritas anteriormente.
11. Limitaciones
La verificación basada en IA no puede:
-
evitar las restricciones de privacidad a nivel del servidor
-
garantizar la identidad de la bandeja de entrada
-
detectar reglas de reenvío interno
-
validar interrupciones temporales del servidor
Estas limitaciones son intrínsecas a la infraestructura de correo electrónico, no a defectos del sistema.
Conclusión
Laverificación del correo electrónico empresarial requiere pruebas sistemáticas de múltiples capas en la sintaxis, el dominio, MX y los indicadores de comportamiento.
La IA mejora este proceso aplicando razonamiento probabilístico, enriquecimiento del contexto y modelado de riesgos, ofreciendo una visión más precisa y solución escalable para calidad de datos B2B.
Un enfoque basado en estándares garantiza la confiabilidad, reduce el riesgo operativo y respalda la automatización de CRM posterior.
