Wie sucht ChatGPT nach Produkten?
ChatGPT nutzt zwei unterschiedliche Wege um Produktinformationen zu finden:
- Trainingsdaten: Was GPTBot vor dem Training gecrawlt hat, ist im Basiswissen von ChatGPT enthalten. Updates gibt es nur bei neuen Trainingsläufen.
- Echtzeit-Websuche (ChatGPT mit Bing): Neuere ChatGPT-Versionen können live im Web suchen — dabei werden aktuelle, indexierte Seiten bevorzugt.
Für sofortige Sichtbarkeit ist die Echtzeit-Suche entscheidend. Für langfristige Präsenz sind Trainingsdaten wichtig. Beide Wege brauchen dieselbe Grundlage: eine crawlbare, strukturierte Produktseite.
GPTBot: Der Crawler von OpenAI
GPTBot ist der offizielle Web-Crawler von OpenAI. Er identifiziert sich als GPTBot/1.1 im User-Agent und folgt den robots.txt-Regeln.
Was GPTBot crawlt — und was nicht:
- ✅ Öffentliches statisches HTML
- ✅ Schema.org-Markup im JSON-LD-Format
- ✅ Seiten die in der Sitemap gelistet sind
- ❌ JavaScript-only-gerenderte Inhalte
- ❌ Seiten hinter Login-Walls
- ❌ Seiten die GPTBot in robots.txt disallowed
GPTBot in robots.txt erlauben
Viele Seiten blockieren GPTBot versehentlich. Prüfe deine robots.txt und stelle sicher dass GPTBot explizit erlaubt ist:
User-agent: GPTBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: Google-Extended
Allow: /
Häufige Fragen
Wie crawlt GPTBot? +
GPTBot crawlt öffentlich zugängliche HTML-Seiten, benötigt Erlaubnis in robots.txt und bevorzugt statisches HTML.
Wann kennt ChatGPT mein Produkt? +
Bei Echtzeit-Suche: 2–14 Tage nach Google-Indexierung. Bei Trainingsdaten: bei künftigen Trainingsläufen von OpenAI.
Was muss ich tun? +
GPTBot in robots.txt erlauben, Schema.org einbauen, statische crawlbare URL pro Produkt — Feed-AI erledigt das automatisch.