Zum Inhalt springen
Pro-Feature · Analytics

🤖 KI-Bot-Tracking: Beweisen Sie, dass Ihre llms.txt funktioniert

📅 März 2026 ⏱ 8 Min. Lesezeit 🏷 GEO, Analytics, Pro-Feature

Sie haben Ihre llms.txt hochgeladen, die robots.txt optimiert und Ihre Inhalte für KI-Systeme aufbereitet. Aber wie wissen Sie, ob GPTBot, ClaudeBot oder PerplexityBot Ihre Seite überhaupt besuchen? KI-Bot-Tracking macht das sichtbar – mit konkreten Zahlen, Datum und Verlauf.

Warum KI-Bot-Tracking entscheidend ist

Die meisten Analytics-Tools – Google Analytics, Plausible, Matomo – messen Nutzer-Traffic, indem sie JavaScript im Browser ausführen und Cookies setzen. KI-Crawler tun beides nicht. Sie laden Seiten serverseitig, führen kein JavaScript aus und akzeptieren keine Cookies. Das Ergebnis: In Ihrer Analytics sehen Sie null Besuche von GPTBot oder ClaudeBot – obwohl diese Bots Ihre Seite möglicherweise täglich aufrufen.

Das erzeugt ein gefährliches Informationsvakuum: Sie optimieren für KI-Sichtbarkeit, aber Sie wissen nicht, ob Ihre Maßnahmen ankommen. KI-Bot-Tracking schließt diese Lücke. Es liefert die einzige verlässliche Antwort auf die Frage: „Liest ChatGPT meine llms.txt wirklich?"

📊 Die wichtigste Kennzahl im GEO: Nicht ob Sie eine llms.txt haben – sondern ob KI-Bots sie auch wirklich abrufen. Beides ist nicht dasselbe.

Was KI-Bot-Tracking konkret zeigt

  • Welche KI-Systeme aktiv sind: GPTBot, ClaudeBot, PerplexityBot, Google-Extended – oder keiner davon
  • Wann der letzte Besuch war: Datum und Uhrzeit des letzten llms.txt-Abrufs
  • Wie oft gecrawlt wird: Frequenz über 30 Tage als Balkendiagramm
  • Welche Domains betroffen sind: Bei mehreren Domains unter einer Pro-Lizenz werden alle separat gezeigt

Wie das Tracking technisch funktioniert

Das Tracking basiert auf einem serverseitigen .htaccess-Redirect für bekannte KI-User-Agents. Wenn GPTBot Ihre llms.txt abruft, greift eine Rewrite-Regel: Der Bot wird kurz zu unserem Tracking-Endpunkt umgeleitet, der den Zugriff mit Timestamp und User-Agent protokolliert – und danach die originale llms.txt unverändert ausliefert.

✓ Kein Eingriff in Ihre Inhalte. KI-Systeme erhalten Ihre llms.txt exakt so, wie Sie sie hinterlegt haben. Der Redirect ist für den Bot transparent – er sieht nur den finalen Inhalt, nicht die Weiterleitung.

Der technische Ablauf in drei Schritten:

  1. Bot trifft auf Ihre llms.txt GPTBot, ClaudeBot oder ein anderer KI-Crawler ruft https://ihredomain.de/llms.txt ab – wie üblich.
  2. Apache-Regel greift (302-Redirect) mod_rewrite erkennt den KI-User-Agent und leitet kurz zu api/bot-tracker.php weiter. Laufzeit: unter 50 ms.
  3. llms.txt wird unverändert ausgeliefert Der Tracker protokolliert Domain, User-Agent und Zeitstempel, dann antwortet er mit dem originalen llms.txt-Inhalt.

Voraussetzungen

  • Apache-Webserver mit mod_rewrite (Standard bei IONOS, Hetzner, Strato, all-inkl.com)
  • Eine aktive Pro-Lizenz für llmstxtgenerator.de
  • Eine erreichbare llms.txt im Webroot (https://ihredomain.de/llms.txt)
⚠ Nginx-Nutzer: Das .htaccess-Snippet funktioniert nur mit Apache. Für Nginx gibt es eine äquivalente Konfiguration über location-Blöcke – kontaktieren Sie uns für die Syntax.

Schritt-für-Schritt: Tracking einrichten

Die Einrichtung dauert unter 3 Minuten und erfordert nur FTP-Zugang zu Ihrer .htaccess.

  1. Pro-Lizenz aktivieren Melden Sie sich auf /tools/bot-stats/ mit Ihrem Lizenzschlüssel an. Format: LLMS-XXXX-XXXX-XXXX-XXXX.
  2. Snippet kopieren Das Bot-Tracking-Tool zeigt Ihnen ein fertig konfiguriertes .htaccess-Snippet für Ihre Domain. Einfach auf „Kopieren" klicken.
  3. In .htaccess einfügen Öffnen Sie die .htaccess im Root-Verzeichnis Ihres Shops via FTP (versteckte Dateien einblenden). Fügen Sie das Snippet ganz am Ende ein – nach allen anderen Regeln.
  4. Datei speichern und warten Sobald der nächste KI-Crawler vorbeikommt, erscheint der Eintrag in Ihrer Statistik. Neue Zugriffe werden mit bis zu 1 Stunde Verzögerung angezeigt.

Das Snippet sieht so aus:

# KI-Bot Tracking – llmstxtgenerator.de <IfModule mod_rewrite.c> RewriteEngine On RewriteCond %{HTTP_USER_AGENT} "(GPTBot|ChatGPT|ClaudeBot|anthropic|PerplexityBot|Google-Extended|Meta-ExternalAgent|Applebot|YouBot|cohere|Diffbot|Amazonbot|bingbot)" [NC] RewriteRule ^llms(-full)?\.txt$ https://llmstxtgenerator.de/api/bot-tracker.php?action=site&site=%{HTTP_HOST}&path=%{REQUEST_URI} [R=302,L] </IfModule>
💡 Gambio, Shopware, WooCommerce: Die .htaccess ist in diesen Shops bereits vorhanden. Via FTP unter „versteckte Dateien anzeigen" öffnen und das Snippet ans Ende anhängen – nicht ersetzen.

Die 13 erkannten KI-Crawler

KI-System User-Agent Betreiber Relevanz
GPTBotGPTBotOpenAI⭐⭐⭐ Hoch
ChatGPT-UserChatGPT-UserOpenAI⭐⭐⭐ Hoch
ClaudeBotClaudeBotAnthropic⭐⭐⭐ Hoch
anthropic-aianthropic-aiAnthropic⭐⭐ Mittel
PerplexityBotPerplexityBotPerplexity⭐⭐⭐ Hoch
Google-ExtendedGoogle-ExtendedGoogle (Gemini)⭐⭐⭐ Hoch
Applebot-ExtendedApplebot-ExtendedApple Intelligence⭐⭐ Mittel
Meta-ExternalAgentMeta-ExternalAgentMeta AI / Llama⭐⭐ Mittel
BytespiderBytespiderByteDance (TikTok)⭐ Niedrig
CCBotCCBotCommon Crawl⭐ Niedrig
cohere-aicohere-aiCohere⭐ Niedrig
DiffbotDiffbotDiffbot⭐ Niedrig
AmazonbotAmazonbotAmazon (Alexa AI)⭐ Niedrig

Für E-Commerce besonders relevant: GPTBot, ChatGPT-User und PerplexityBot sind die Plattformen, die aktiv für Produktempfehlungen genutzt werden. Wenn diese drei Ihre llms.txt nicht lesen, fehlt Ihnen der direkte Kanal zu den meistgenutzten KI-Assistenten.

Ergebnisse verstehen und interpretieren

Das Bot-Statistik-Tool zeigt nach der Einrichtung drei Kennzahlen auf einen Blick: Gesamtaufrufe (letzte 3 Monate), Anzahl erkannter KI-Systeme und Anzahl Domains. Darunter erscheint ein Balkendiagramm der letzten 30 Tage und eine Tabelle pro Domain.

Was bedeuten die verschiedenen Szenarien?

✓ Mehrere Bots, regelmäßig

Ideal. GPTBot, ClaudeBot und PerplexityBot kommen wöchentlich. Ihre GEO-Strategie greift – jetzt Qualität der llms.txt optimieren und aktuell halten.

✓ Ein Bot, erste Zugriffe

Guter Start. Weitere Bots kommen oft erst nach 2–4 Wochen. Prüfen Sie, ob robots.txt alle Crawler erlaubt.

⚠ Keine Zugriffe nach 2 Wochen

Snippet noch nicht aktiv, llms.txt nicht erreichbar oder robots.txt blockiert KI-Bots. Checkliste weiter unten hilft.

✗ Snippet installiert, null Treffer

Häufigstes Problem: Snippet wurde nicht am Ende der .htaccess eingefügt, sondern mittendrin – oder mod_rewrite ist deaktiviert.

Crawl-Frequenz: Was ist normal?

KI-Crawler verhalten sich anders als Googlebot. Während Google Ihre Seite täglich oder stündlich besucht, kommen KI-Bots deutlich seltener:

  • GPTBot: Alle 1–3 Wochen bei aktiven Domains
  • ClaudeBot: Unregelmäßig, teilweise wöchentlich
  • PerplexityBot: Häufiger, teils täglich bei hoch-relevantem Content
  • Google-Extended: Gebunden an den regulären Googlebot-Zyklus

Keine Zugriffe in den ersten 7 Tagen nach Einrichtung sind normal. Die meisten Shops sehen erste Crawler-Besuche nach 1–4 Wochen.

Wenn kein Bot kommt – Ursachen und Lösungen

Wenn das Tracking nach mehr als zwei Wochen keine Zugriffe zeigt, prüfen Sie diese Punkte der Reihe nach:

  1. Ist die llms.txt direkt erreichbar?
    Rufen Sie https://ihredomain.de/llms.txt im Browser auf. Sie sollte ohne Weiterleitung laden. Wenn sie fehlt oder 404 zeigt, hilft der Generator.
  2. Blockiert die robots.txt KI-Crawler?
    Prüfen Sie mit dem robots.txt KI-Check, ob GPTBot oder ClaudeBot blockiert werden. Ein Disallow: / für diese User-Agents verhindert jeden Crawler-Besuch.
  3. Sitzt das Snippet an der richtigen Stelle?
    Das .htaccess-Snippet muss am Ende der Datei stehen – nach allen anderen Rewrite-Regeln. Steht es davor, können Shop-eigene Regeln es überschreiben.
  4. Ist mod_rewrite aktiv?
    Bei manchen Hosts muss mod_rewrite erst im Hosting-Panel aktiviert werden. Im Zweifel: Hosting-Support kontaktieren.
  5. Wurde die llms.txt irgendwo eingereicht?
    Aktives Einreichen über den AI-Push beschleunigt die Entdeckung erheblich – statt passiv auf den nächsten Crawl zu warten.
🤖
robots.txt KI-Check
Prüfen Sie in Sekunden, ob Ihre robots.txt KI-Crawler blockiert

Häufige Fragen

Verlangsamt das Tracking meine Website?

Nein. Der Redirect gilt ausschließlich für bekannte KI-User-Agents, nicht für normale Besucher. Der Tracking-Request dauert unter 50 ms und beeinflusst die Ladezeit Ihrer Seite für Nutzer nicht.

Werden meine Inhalte an Dritte übertragen?

Das Tracking-System protokolliert ausschließlich: Domain-Name, User-Agent des Crawlers und Zeitstempel. Keine Inhalte, keine IP-Adressen von Nutzern, keine Cookies. Die Daten werden ausschließlich für die Statistikdarstellung genutzt.

Funktioniert das auch mit llms-full.txt?

Ja. Das Snippet überwacht sowohl llms.txt als auch llms-full.txt – erkennbar am llms(-full)?\.txt in der RewriteRule.

Was passiert, wenn ich das Snippet entferne?

KI-Crawler erhalten Ihre llms.txt dann wieder direkt – ohne Tracking. Alle bisher gespeicherten Statistiken bleiben erhalten und sind weiterhin über das Bot-Statistik-Tool abrufbar.

Kann ich mehrere Domains mit einer Lizenz tracken?

Ja. Pro-Lizenzen erlauben mehrere Domains. Das Statistik-Tool zeigt jede Domain mit eigenem Verlauf und eigenem Crawler-Tableau.

📊 KI-Bot-Tracking jetzt einrichten

Sehen Sie live, welche KI-Systeme Ihre llms.txt bereits lesen – mit Datum, Häufigkeit und 30-Tage-Verlauf. Pro-Feature, einmalig einrichten.

Bot-Tracking starten →

Funktioniert mit Apache – Standard bei IONOS, Hetzner, Strato, all-inkl.com

📊
Praxisbericht: Erste echte Tracking-Daten von solar-autark.com

Vom Tracking zur vollständigen GEO-Strategie

KI-Bot-Tracking ist der Beweis, dass Ihre Optimierungsmaßnahmen ankommen. Es ist aber nur ein Teil der vollständigen GEO-Strategie:

  1. Prüfen – robots.txt und KI-Sichtbarkeit checken (→ Komplett-Audit)
  2. Erstellen – llms.txt mit echten Produktdaten generieren (→ Generator)
  3. Verteilen – Aktiv bei KI-Plattformen einreichen (→ AI-Push)
  4. Messen – Bot-Tracking einrichten, Baseline erstellen (→ Bot-Statistiken)
  5. Wiederholen – llms.txt bei Sortimentsänderungen aktualisieren

Bereit, Ihren KI-Traffic zu beweisen?

Richten Sie das Bot-Tracking ein und erfahren Sie in den nächsten Tagen, welche KI-Plattformen Ihre Inhalte bereits aufrufen.

Bot-Statistiken ansehen →