AI Lead Collector – Woche 3

AI Lead Collector: Nie wieder Copy & Paste aus Impressumsseiten!

Bei einem früheren Job im Bereich Kundenakquise habe ich erlebt, wie mühsam Lead-Recherche sein kann. Gekaufte Leads sind oft von zweifelhafter Qualität – und wenn man selbst recherchiert, verbringt man Stunden damit, Adressen aus Impressumsseiten zu kopieren.

Also dachte ich mir: Das muss doch einfacher gehen.
Eine Browser-Extension, die Impressumsdaten automatisch ausliest und in eine Datenbank einträgt.

Meine Anforderungen

  • Daten mit einem Klick aus einer Impressumsseite ziehen

  • Korrekturen direkt im Popup-Formular machen

  • Leads nicht in Excel händisch pflegen, sondern sauber in einer Datenbank speichern

  • Alles in einer Woche umsetzbar

Mein AI-Workflow

Wie immer habe ich mit AI-Unterstützung gearbeitet – diesmal aber mit einer Besonderheit:
Normalerweise baue ich meine Projekte mit Claude, aber in dieser Woche hatte ich kurzfristig keinen Zugriff und bin stärker auf ChatGPT ausgewichen.

Und das war… sagen wir mal: lehrreich.

  • ChatGPT hat gerne Features „hinzugefügt“, die ich gar nicht wollte (z. B. automatisch (at) in E-Mails in ein @ verwandeln – und plötzlich tauchten @-Zeichen mitten in Straßennamen auf).

  • Oft hat er mir nicht den kompletten Code gegeben oder nicht alle Dateien gelesen.

  • Ergebnis: Ich musste das Modell sehr viel enger steuern, damit ich am Ende wirklich den Code bekam, den ich brauchte.

Fazit: Für zukünftige Projekte bleibe ich beim Coden wieder eher bei Claude. ChatGPT hat mir zwar auch geholfen, aber manchmal eher… kreativ als hilfreich. 😅

Was die Extension kann

👉 Du gehst auf eine Impressumsseite.
👉 Klick auf „Daten extrahieren“.
👉 Die Extension schickt den Seiteninhalt an mein Backend.
👉 Das Backend extrahiert mit AI die Felder (Firma, Adresse, E-Mail, Telefon).
👉 Im Popup kannst du alles prüfen, ggf. korrigieren und speichern.
👉 Die Leads landen in einer Datenbank und können wieder angezeigt werden.

Das UI im Popup ist schlicht, aber funktional – Formular, Buttons, eine Leads-Liste. Kein Overkill, sondern auf den Kern fokussiert.

Stack & Tools

  • Extension: Manifest v2, Content Script, Popup-UI

  • Backend: Flask + MariaDB, läuft in Docker-Containern

  • AI: Groq LLM (für die eigentliche Datenextraktion)

  • Dev: Docker Compose, Claude & ChatGPT (diesmal mehr ChatGPT)

Herausforderungen & Learnings

  • Docker: Ich habe mich das erste Mal ausgiebiger mit Docker beschäftigt. Anfangs habe ich bei jeder Änderung docker compose down && up gemacht – bis ich irgendwann herausfand, dass man Container auch automatisch refreshen lassen kann. Das war ein kleiner „Aha!“-Moment. 

  • Backend selbst gebaut: Statt n8n diesmal ein eigenes Flask-Backend. Mehr Verantwortung, aber auch viel mehr Kontrolle.

  • Datenaufbereitung ist entscheidend:

    • Zeilenumbrüche erhalten, damit PLZ und Hausnummer nicht vermischt werden.

    • Rohdaten übernehmen, nicht „verschönern“ – sonst hat man zwar hübsche, aber falsche Daten.

    • Regex-Fallbacks für PLZ/Ort, falls die AI unsicher ist.

  • AI beim Coding: ChatGPT war manchmal frustrierend. Ich habe viel gelernt über Prompting und Kontrolle – aber nächstes Mal bleibe ich lieber bei Claude.

Keine Live-Demo dieses Mal

Normalerweise erstelle ich für meine Projekte gerne eine kleine Demo-Seite.
Dieses Mal nicht.

Warum?
Die Extension ist mit einem Backend und einer Datenbank verbunden. Das heißt: Im Frontend könnte man die komplette Liste aller gespeicherten Leads sehen. Und wenn mehrere Leute die Extension nutzen würden, wären plötzlich alle Leads für alle sichtbar – datenschutzmäßig ein No-Go.

Das Projekt war zwar als Lernübung gedacht, aber genau solche Überlegungen gehören für mich dazu: Software ist nicht nur ein technisches Experiment, sondern muss auch verantwortungsvoll mit Daten umgehen.

Fazit

Woche 3: ✅

Ich habe gelernt, ein eigenes Backend in Docker aufzusetzen, wie wichtig saubere Datenaufbereitung für AI ist – und dass nicht jedes LLM gleich gut als Coding-Buddy taugt.

Die Extension war ein Lernprojekt, aber theoretisch sofort nutzbar. Der nächste logische Schritt wäre: das Impressum einer beliebigen Website automatisch finden. Klingt einfach, ist es aber nicht – moderne Webseiten verstecken ihre Links gerne in dynamischen Menüs.

Ich freue mich schon auf Woche 4 – mal sehen, welche Idee mir als Nächstes kommt. 😉

Related Posts

Website – Woche 30

TL;DR Diese Woche habe ich meine neue Website für Dashboards und Datenautomation fertiggestellt; inhaltlich, visuell und rechtlich. Die Seite zeigt

Read More