Metagoofil – Tutoriel Étape par Étape (Extraction de Métadonnées)

par Bertrand COFFIN

🛠 Metagoofil – Tutoriel Étape par Étape (Extraction de Métadonnées)


🔍 1. Présentation Générale

Metagoofil est un outil développé pour rechercher, télécharger et extraire les métadonnées de fichiers disponibles en ligne, notamment via Google.

🎯 Objectif OSINT : Identifier des noms d’utilisateurs, chemins de fichiers internes, versions logicielles, structure d’organisation, localisation, etc.


📦 2. Installation de Metagoofil

✅ Prérequis :

  • Python 2.7 (ou virtualenv avec rétrocompatibilité)

  • Linux recommandé (Kali Linux, Parrot, Ubuntu)

💻 Installation :

git clone https://github.com/laramies/metagoofil.git
cd metagoofil
pip install -r requirements.txt # si le fichier existe

💡 Si besoin, installe exiftool ou libextractor, selon la méthode d’extraction choisie.


🧭 3. Syntaxe de Base

python metagoofil.py -d <domaine> -t <type> -l <limite> -n <nb fichiers à télécharger> -o <répertoire> -f <fichier html>

✨ Exemple simple :

python metagoofil.py -d exemple.com -t pdf,doc,xls -l 100 -n 20 -o resultat/ -f rapport.html

🔧 4. Explication des Paramètres

Paramètre Description
-d Domaine cible (ex. orange.fr)
-t Types de fichiers à chercher (pdf, doc, ppt, xls, etc.)
-l Limite du nombre de résultats Google
-n Nombre de fichiers à télécharger
-o Dossier de sortie
-f Nom du rapport HTML généré

🧪 5. Étude de cas pédagogique

🎯 Objectif : Identifier les personnes travaillant chez example.com via leurs documents publics

  1. Crée un dossier pour stocker les fichiers :

    mkdir ~/osint_metagoofil
  2. Lancer la collecte :

    python metagoofil.py -d example.com -t pdf,docx,pptx -l 50 -n 10 -o ~/osint_metagoofil -f rapport_exemple.html
  3. Le script :

    • Utilise Google pour rechercher des fichiers.

    • Télécharge les fichiers trouvés.

    • Extrait automatiquement les métadonnées.

  4. Analyser le fichier rapport_exemple.html :

    • Nom de l’auteur du document.

    • Système d’exploitation (ex : Windows 10).

    • Chemin du document (C:UsersJeanBureauprojet.docx).

    • Adresse email intégrée dans un PowerPoint.

    • Version de MS Office utilisée.


🧠 6. Cas d’usages pédagogiques

Domaine Utilisation
🎓 Cours en cybersécurité Identifier les fuites d’informations non intentionnelles
🕵️‍♂️ Pentest Collecter noms d’utilisateurs pour brute-force ou ingénierie sociale
📰 Journalisme Trouver des documents créés par des institutions ou entreprises
👨‍💼 Audit interne Repérer les métadonnées sensibles laissées dans les documents

🔐 7. Éthique et Légalité

  • ✅ Légal : Metagoofil n’accède qu’à des documents publics.

  • ⚠ Sensibilité : Les métadonnées peuvent contenir des noms de personnes, adresses, documents internes – ne pas en abuser.

  • 🇪🇺 Conformité RGPD : Ne jamais publier des noms ou données personnelles sans consentement.


📚 8. Compléments utiles

📦 Outils similaires / complémentaires :

Outil Usage
ExifTool Extraction de métadonnées avancées pour fichiers médias
FOCA (Windows) Interface graphique pour collecte et analyse de métadonnées
Pdfinfo, Docx2txt Extraction manuelle en ligne de commande

🧾 9. Rapport d’enquête OSINT (Exemple pédagogique)

Fiche d’extraction type :

Fichier Auteur Chemin interne Date Version
rapportRH.pdf Jean Dupont C:UsersJeanBureau 2023-11-02 Word 2016

💡 Pro Tip : Utilise ces noms pour compléter des attaques par dictionnaire (john, hydra, cewl) – dans un cadre légal uniquement (pentest autorisé).


🎓 10. Atelier pédagogique OSINT

Atelier « Reconnaissance Passive avec Metagoofil » :

  • Objectif : Identifier au moins 3 noms d’employés et 2 informations techniques à partir d’un domaine.

  • Durée : 45 minutes.

  • Matériel : Kali / Ubuntu + Metagoofil

  • Déroulement :

    1. Exécution de la commande

    2. Annotation des métadonnées utiles

    3. Comparaison croisée avec LinkedIn ou Hunter.io

L’article Metagoofil – Tutoriel Étape par Étape (Extraction de Métadonnées) est apparu en premier sur Brainstormi : Libérez votre créativité grâce à l’IA .