
Ce document définit les normes, règles et contrôles procéduraux utilisés par les systèmes basés sur l'IA pour valider les adresses e-mail professionnelles dans les environnements B2B.
Il fournit un cadre de vérification structuré applicable aux ensembles de données à grande échelle, aux pipelines CRM et aux systèmes d'extraction automatisés.
L'objectif est de garantir l'exactitude, la conformité et la fiabilité opérationnelle.
1. Portée de la validation
La norme de validation s'applique à :
-
e-mails professionnels extraits
-
Enregistrements d'e-mails importés par CRM
-
ensembles de données tiers enrichis
-
résultats de la génération de leads
-
pipelines de sensibilisation automatisés
Objectifs principaux
-
éliminer les adresses e-mail invalides ou mal formées
-
éviter les erreurs de livraison
-
réduire les taux de rebond
-
identifier les domaines à haut risque ou invérifiables
-
différencier les sources de messagerie professionnelles des sources de messagerie non professionnelles
2. Définitions
E-mail professionnel
Adresse e-mail associée à un domaine d'entreprise, institutionnel ou commercial vérifiable.
Statut de validation
Le résultat de la classification (valide, risqué, invérifiable, invalide).
Score de risque
Évaluation numérique représentant la probabilité d'un échec de livraison ou d'une incompatibilité d'identité.
Enregistrement MX
Enregistrement d'échange de courrier indiquant la capacité du serveur de messagerie du domaine.
3. Catégories de vérification
La vérification des e-mails est divisée en quatre catégories principales :
Catégorie A — Validation au niveau de la syntaxe
Veille à ce que le format de l'e-mail corresponde aux règles structurelles.
Catégorie B — Validation au niveau du domaine
Confirme que le domaine existe et peut être résolu.
Catégorie C — Validation au niveau MX et SMTP
Valide si le domaine peut recevoir du courrier.
Catégorie D — Indicateurs de risque et de comportement
Utilise l'IA et les modèles de données pour déterminer la fiabilité.
Ces catégories fonctionnent de manière séquentielle mais peuvent être déclenchées indépendamment.
4. Normes de validation de syntaxe (catégorie A)
L'e-mail doit être conforme aux règles de syntaxe compatibles RFC 5322.
Composants requis
-
partie locale
-
Séparateur « @ »
-
domaine
Erreurs de syntaxe signalées
-
points répétés
-
points de début/fin
-
caractères spéciaux invalides
-
segments de domaine manquants
-
inclusion d'espaces
Critères d'acceptation
Si la validation de la syntaxe échoue, l'e-mail est marqué invalide sans autre test.
5. Normes de validation de domaine (Catégorie B)
AI effectue des vérifications au niveau du domaine pour confirmer :
5.1 Existence de domaine
-
Recherche DNS
-
Disponibilité WHOIS
-
tolérance d'âge du domaine
5.2 Classification des domaines
-
domaine métier
-
domaine jetable
-
fournisseur de messagerie gratuit
-
domaine de boîte aux lettres personnelle
5.3 Signaux de risque d'entreprise
-
sites Web inactifs
-
certificats SSL expirés
-
métadonnées d'entreprise incompatibles
Seuls les domaines classés comme entités commerciales valides font l'objet d'une validation MX.
6. Protocoles de validation MX et SMTP (catégorie C)
Cette catégorie vérifie la capacité de réception de courrier du domaine.
6.1 Vérification des enregistrements MX
-
présence d'entrées MX
-
priorisation des serveurs
-
cohérence du serveur
6.2 Logique de simulation SMTP
L'IA effectue une simulation non intrusive sans terminer le transfert du courrier.
Les contrôles incluent :
-
Comportement de réponse « RCPT TO »
-
Détection fourre-tout
-
probabilité d'existence d'une boîte aux lettres
6.3 Interprétation du comportement du serveur
Les réponses du serveur peuvent inclure :
-
accepter
-
rejeter
-
accepter tout
-
rejet temporaire
-
réponses ambiguës
L'IA classe les résultats ambigus en catégories probabilistes.
7. Modèle de notation des risques (catégorie D)
Si la validation ne peut pas confirmer la délivrabilité, un score de risque est attribué.
Indicateurs de risque
-
utilisation de boîtes de réception génériques (info@ / sales@)
-
comportement de domaine fourre-tout
-
faibles signaux d'activité des entreprises
-
domaines suspects ou récemment créés
-
métadonnées incohérentes entre les sources
Spectre de score de risque
-
0–20 : Confiance élevée
-
21-50 : Confiance modérée
-
51-80 : Risque élevé
-
81-100 : Risque très élevé/invérifiable
Les systèmes sortants peuvent traiter les scores supérieurs à 60 comme restreints.
8. Logique de décision multicouche
Après toutes les vérifications, l'IA attribue l'un de ces statuts :
Valide
Syntaxe correcte, domaine résolu, vérification MX, faible risque.
Valide avec prudence
Syntaxe correcte, domaine valide, réponse SMTP fourre-tout ou ambiguë.
Risique
Plusieurs indicateurs de risque, validation partielle uniquement.
Invérifiable
Syntaxe correcte, domaine incohérent ou ambigu, aucune réponse MX fiable.
Invalide
Échec de la syntaxe ou de la résolution du domaine.
Cette logique garantit une classification cohérente sur de grands ensembles de données.
9. Gestion des cas Edge
Le système doit traiter correctement :
-
e-mails basés sur des alias
-
domaines de transfert uniquement
-
domaines d'entreprise récemment enregistrés
-
fournisseurs de messagerie multi-locataires (par exemple, Google Workspace for SMBs)
-
structures de domaines régionaux (par exemple, .com.cn, .co.uk)
La gestion des cas extrêmes améliore la précision des ensembles de données globaux.
10. SaleAI Contexte (non promotionnel)
Dans l'écosystème SaleAI :
-
Les
Les agents de données analysent la syntaxe, le domaine, le MX et les signaux de risque comportemental
-
Les agents CRM utilisent le résultat de la vérification pour protéger les séquences et les flux de sensibilisation
-
Agents de navigation valident le contexte du domaine d'entreprise lors de l'interaction avec des sources Web
SaleAI ne modifie pas les critères de vérification ; il suit les règles standardisées décrites ci-dessus.
11. Limites
La vérification basée sur l'IA ne peut pas :
-
contourner les restrictions de confidentialité au niveau du serveur
-
garantir l'identité de la boîte de réception
-
détecter les règles de transfert internes
-
valider les pannes temporaires du serveur
Ces limitations sont intrinsèques à l'infrastructure de messagerie et non à des défauts du système.
Conclusion
LaLa vérification des e-mails professionnels nécessite des tests systématiques et multicouches sur la syntaxe, le domaine, le MX et les indicateurs comportementaux.
L'IA améliore ce processus en appliquant un raisonnement probabiliste, un enrichissement du contexte et une modélisation des risques, offrant ainsi une approche plus précise et plus précise. solution évolutive pour la qualité des données B2B.
Une approche basée sur des normes garantit la fiabilité, réduit les risques opérationnels et prend en charge l'automatisation du CRM en aval.
