GPTBot von OpenAI crawlt öffentlich zugängliche HTML-Seiten. Er benötigt explizite Erlaubnis in robots.txt und bevorzugt statisches HTML über JavaScript-Rendering.

Was muss ich für ChatGPT-Sichtbarkeit tun?

GPTBot in robots.txt erlauben, Schema.org Product-Markup einbauen, statische crawlbare URL pro Produkt bereitstellen.

ChatGPT Sichtbarkeit — So findet GPTBot dein Produkt

Wie sucht ChatGPT nach Produkten?

ChatGPT nutzt zwei unterschiedliche Wege um Produktinformationen zu finden:

Trainingsdaten: Was GPTBot vor dem Training gecrawlt hat, ist im Basiswissen von ChatGPT enthalten. Updates gibt es nur bei neuen Trainingsläufen.
Echtzeit-Websuche (ChatGPT mit Bing): Neuere ChatGPT-Versionen können live im Web suchen — dabei werden aktuelle, indexierte Seiten bevorzugt.

Wichtig

Für sofortige Sichtbarkeit ist die Echtzeit-Suche entscheidend. Für langfristige Präsenz sind Trainingsdaten wichtig. Beide Wege brauchen dieselbe Grundlage: eine crawlbare, strukturierte Produktseite.

GPTBot: Der Crawler von OpenAI

GPTBot ist der offizielle Web-Crawler von OpenAI. Er identifiziert sich als GPTBot/1.1 im User-Agent und folgt den robots.txt-Regeln.

Was GPTBot crawlt — und was nicht:

✅ Öffentliches statisches HTML
✅ Schema.org-Markup im JSON-LD-Format
✅ Seiten die in der Sitemap gelistet sind
❌ JavaScript-only-gerenderte Inhalte
❌ Seiten hinter Login-Walls
❌ Seiten die GPTBot in robots.txt disallowed

GPTBot in robots.txt erlauben

Viele Seiten blockieren GPTBot versehentlich. Prüfe deine robots.txt und stelle sicher dass GPTBot explizit erlaubt ist:

User-agent: GPTBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: Google-Extended
Allow: /

Häufige Fragen

Wie crawlt GPTBot? +

GPTBot crawlt öffentlich zugängliche HTML-Seiten, benötigt Erlaubnis in robots.txt und bevorzugt statisches HTML.

Wann kennt ChatGPT mein Produkt? +

Bei Echtzeit-Suche: 2–14 Tage nach Google-Indexierung. Bei Trainingsdaten: bei künftigen Trainingsläufen von OpenAI.

Was muss ich tun? +

GPTBot in robots.txt erlauben, Schema.org einbauen, statische crawlbare URL pro Produkt — Feed-AI erledigt das automatisch.