TheHarvester – Tutoriel Étape par Étape (OSINT Emails & Domaines)

par Bertrand COFFIN

🛠️ TheHarvester – Tutoriel Étape par Étape (OSINT Emails & Domaines)


🔍 1. Présentation Générale

TheHarvester est un outil en ligne de commande, utilisé pour collecter :

  • 📧 Adresses emails

  • 🌐 Sous-domaines et noms de domaine

  • 🏁 Adresses IP associées

  • 📍 Informations publiques issues de moteurs de recherche, réseaux sociaux, shodan, etc.

Idéal pour les pentesters, analystes cyber, ou toute démarche OSINT liée à la reconnaissance passive.


🧱 2. Installation

Sous Kali Linux (déjà installé) :

theHarvester

Installation manuelle (autres systèmes) :

git clone https://github.com/laramies/theHarvester.git
cd theHarvester
pip3 install -r requirements/base.txt
python3 theHarvester.py

📌 3. Principales Sources Compatibles

TheHarvester peut interroger plusieurs sources :

  • 🔎 google, bing, duckduckgo, yahoo, baidu

  • 🔧 hunter, linkedin, twitter, github, linkedin_links

  • 🛜 shodan, crtsh, anubis, netcraft, threatminer, certspotter

Certaines sources nécessitent une clé API (ex : Shodan, Hunter.io, Bing).


🧭 4. Syntaxe de Base

theHarvester -d <domaine> -b <source> [-l <limite>] [-f <fichier>]

Exemple simple :

theHarvester -d example.com -b google
  • -d : Domaine cible

  • -b : Moteur ou source utilisée

  • -l : Nombre de résultats à récupérer (optionnel)

  • -f : Génère un fichier HTML avec les résultats


🧪 5. Exemple de Cas Pratique

Recherche d’emails et sous-domaines liés à « example.com » :

theHarvester -d example.com -b bing -l 100

Utiliser plusieurs sources avec rapport :

theHarvester -d example.com -b google,bing,certspotter -l 200 -f rapport_osint

Résultat : fichier rapport_osint.html + fichier .xml dans le dossier courant.


🧠 6. Fonctionnement pédagogique (Workflow de collecte)

  1. 🧭 Choisir une cible : ex. target.com

  2. 🛠️ Lancer les requêtes avec plusieurs moteurs pour élargir la collecte

  3. 📑 Analyser les emails et sous-domaines découverts

  4. 🧩 Compléter l’analyse avec :


💾 7. Exportation des Résultats

theHarvester -d example.com -b google -l 100 -f resultats_example
  • Génère : resultats_example.html et resultats_example.xml

💡 Astuce pédagogique : tu peux intégrer ces fichiers dans un rapport d’enquête OSINT avec screenshots et commentaire des sources utilisées.


📚 8. Bonnes pratiques d’utilisation

  • 🔒 Reste dans un cadre légal et éthique : ne cible que des domaines publics ou autorisés.

  • 🔁 Multiplie les sources pour enrichir les résultats.

  • 📤 Combine les emails découverts avec email verification tools (ex : Email-Checker, Verify-email.org).


🔧 9. Liens et Documentation

  • 📘 Repo GitHub : https://github.com/laramies/theHarvester

  • 📄 Documentation (sources, flags) : python3 theHarvester.py -h

  • 🎓 Alternative graphique (facultative) : intégrer dans une VM ou une interface GUI via ReconPi, BlackArch, etc.


🎓 10. Atelier Pédagogique (Exercice OSINT)

Objectif : identifier les emails, sous-domaines et IP d’une cible donnée.

  1. Choisis un site d’entreprise (ex. orange.fr)

  2. Lance plusieurs commandes avec différentes sources :

    theHarvester -d orange.fr -b bing,crtsh,certspotter -l 200 -f orange_osint
  3. Analyse le fichier HTML généré

  4. Vérifie les emails avec Hunter.io ou HaveIBeenPwned

  5. Analyse les IP sur Shodan

💡 Tu peux croiser avec Recon-ng ou SpiderFoot pour créer un rapport complet.