A cikkei a Google első oldalán vannak, mégsem idézi őket a ChatGPT, a Claude vagy a Perplexity. Nem a tartalommal van a baj. A tartalom technikai adósságába ragadt — és ezt meglepően gyorsan ki lehet fizetni. A lényeg 20 másodpercben

Egyre több cégvezető ül le velünk ugyanazzal a mondattal: „Megkérdeztem a ChatGPT-t, hogy ki a legjobb beszállító a piacomon — és a versenytársaimat sorolta fel. Engem nem.”

Az ilyenkor szinte automatikus reakció a pánik: biztos a tartalom gyenge, kell még húsz blogcikk. A valóságban a tartalom gyakran kifogástalan. A probléma az, hogy az AI a tartalom egy részét fizikailag nem látja. Nem rangsorolja rosszul — egyszerűen nem jut hozzá.

Itt jön a kulcsfogalom, amit a legtöbb marketinges kihagy: a technikai adatadósság. Ez az a felgyülemlett, láthatatlan teher — renderelésre váró JavaScript, lezárt dokumentumok, félrekonfigurált hozzáférés —, ami miatt egy egyébként remek oldal a generatív keresők számára üres helyként jelenik meg. A jó hír: ez nem kreatív, hanem mérnöki probléma, és ezért megoldható.

Miért lát a Google olyat, amit a ChatGPT nem?

A legtöbb tévhit innen ered: „Ha a Google le tudja olvasni az oldalamat, akkor az AI is.” Ez 2026-ban egyszerűen nem igaz, és a különbség pénzbe kerül.

A Googlebot egy fejlett kétfázisú rendszerrel dolgozik: egy fejléc nélküli (headless) Chrome-mal lefuttatja az oldal JavaScriptjét, megvárja, amíg betöltődik a dinamikus tartalom, és csak utána indexel. Az AI botok — a GPTBot, a ClaudeBot, a PerplexityBot — ezt nem teszik meg. Letöltik a nyers HTML-t, kiolvassák, ami benne van, és továbbállnak. Nincs renderelés, nincs várakozás, nincs második próbálkozás.

A Vercel és a MERJ közös, több mint félmilliárd GPTBot-lekérésre kiterjedő elemzése egyértelmű volt: nulla bizonyíték JavaScript-futtatásra. A botok le-letöltik a JS-fájlokat (a Claude crawlere a kérések közel negyedénél, a ChatGPT-é nagyjából a tizedénél), de soha nem futtatják le őket. Ami csak a kód lefutása után jelenne meg, az számukra nem létezik.

CrawlerMit hajtJavaScriptet renderel?
GooglebotGoogle Search, AI Overviews, GeminiIgen (késleltetéssel)
BingbotBing, részben a ChatGPT keresésRészben
GPTBot / OAI-SearchBotChatGPTNem
ClaudeBotClaudeNem
PerplexityBotPerplexityNem

Forrás: Vercel & MERJ crawler-elemzés, valamint független technikai SEO-auditok, 2026.

A JavaScript-csapda — a legdrágább hiba

A modern weboldalak nagy része kliensoldali rendereléssel (CSR) készül: React, Vue vagy Angular, ahol a böngésző állítja össze a tartalmat futás közben. Az ember tökéletes oldalt lát. A bot viszont egy üres vázat kap: egy navigációt, egy üres

konténert és néhány script-hivatkozást. A termékleírás, az árak, az összehasonlító táblázat, a GYIK — mind a script lefutása után jelenne meg, amit a bot nem vár meg.

És itt nincs „félig látható”. Vagy benne van a tartalom a nyers HTML-ben, vagy nincs. Ha üres a váz, az AI számára az egész oldal nem létezik — nem gyengén teljesít, hanem hiányzik.

Ráadásul az AI botok nem görgetnek. A „lazy load” technikával, görgetésre betöltődő tartalom (alsóbb szekciók, kép alatti szövegek, végtelen listák) így rendszeresen láthatatlan marad akkor is, ha egyébként a HTML-ben lenne.

Amit a bot lát (CSR)

Üres váz. Nulla mondat, nulla szakéma, nulla idézhető tény.

Amit látnia kellene (SSR)

Hőszivattyús fűtés...

Ár, előny, GYIK, séma...

Kész szöveg már a forráskódban. Idézhető, indexelhető, citálható.

Hogyan javítsa ki

  • Szerveroldali renderelés (SSR) vagy statikus generálás (SSG): Next.js, Nuxt, Astro vagy Angular Universal — a lényeges tartalom már a szerverválaszban ott legyen.
  • Ha az SSR-migráció most nem fér bele, használjon prerenderelést a botok kiszolgálására.
  • A 10 másodperces teszt: nyissa meg az oldalt, kapcsolja ki a JavaScriptet (vagy nézze meg a „Forrás megtekintése”-t). Amit így nem lát, azt a bot sem.
  • A JSON-LD szakémának is a nyers HTML-ben kell lennie, nem JavaScripttel utólag beinjektálva.

A zárt PDF-ek — a csapdába esett tudás

A legértékesebb szakmai tartalom — esettanulmányok, fehérkönyvek, árlisták, kutatási eredmények — gyakran PDF-ben él. És itt egy fontos különbséget kell tenni, mert nem minden PDF egyforma a botok szemében.

  • Szöveges PDF: ebből a tartalom kiolvasható, az AI fel tudja dolgozni. Ez a jó eset.
  • Szkennelt, képből álló PDF: a bot csak egy képet lát. Szöveg csak OCR-rel nyerhető ki belőle, ami soha nem tökéletes — nevek, számok, ékezetek (ő, ű) torzulnak, táblázatok szétesnek.
  • Titkosított / jelszavas PDF: a szöveg egyáltalán nem nyerhető ki. Sem indexelni, sem AI-modellbe betáplálni nem lehet. Teljes némaság.
  • Címkézetlen (untagged) PDF: hiányzik a szerkezeti információ, így az olvasás sorrendje összekuszálódhat — a többhasábos elrendezés vagy a táblázat olvashatatlan masszává válik.

A gyakorlati következmény fájdalmas: ha a legjobb érveit egy szépen tördelt, de képből exportált prospektusba zárta, az AI számára az a tudás nem létezik. A versenytárs, aki ugyanezt egy egyszerű HTML-oldalra is kitette, megjelenik a válaszokban. Ön nem.

Hogyan javítsa ki

  • HTML-first elv: a kulcstartalom (árak, előnyök, GYIK, esettanulmány-összefoglaló) éljen rendes weboldalon. A PDF legyen a letölthető „bónusz”, ne az egyetlen forrás.
  • Ha PDF kell, legyen valódi szöveges (nem kép-) PDF, megfelelő címkézéssel és, szkennelt anyag esetén, OCR-réteggel.
  • Egyszerű ellenőrzés: nyissa meg a PDF-et, és próbálja kijelölni a szöveget egérrel. Ha nem tudja kijelölni, a bot sem tudja kiolvasni.

A hiányzó llms.txt — és az árnyalt igazság

Az llms.txt egy egyszerű Markdown-fájl a domain gyökerében (https://pelda.hu/llms.txt), amely egyetlen, tiszta listában megmutatja a legfontosabb oldalait — egyfajta „tartalomtérkép” a nyelvi modelleknek. A GEO-szakma 2024 vége óta szinte csodaszerként árulja. Itt jön a rész, amit a legtöbb marketingügynökség elhallgat.

A valóság 2026-ban: az SE Ranking 300 000 domainre kiterjedő vizsgálata szerint az llms.txt elfogadottsága nagyjából 10%, és nem nő gyorsan. Ennél is fontosabb: a Limy több mint félmilliárd AI-bot eseményre épülő elemzése azt találta, hogy a keresőcélú botok — GPTBot, ClaudeBot, PerplexityBot, OAI-SearchBot — jellemzően meg sem nyitják az llms.txt-t, hanem egyenesen a HTML-t térképezik fel. Több független SEO-vizsgálat sem mért kimutatható forgalom- vagy idézettségnövekedést a bevezetése után. A Google részéről John Mueller is óvatosságra intett: szerinte ez kísértetiesen emlékeztet a kulcsszavak meta-tagre, amit a Google már rég nem használ.

Akkor felesleges? Nem — csak nem ott hat, ahol mindenki keresi. Az igazi haszna az ágensalapú webben van. A kódoló és kutató AI-ágensek — a Cursor, a Windsurf, a Claude Code, a GitHub Copilot — rutinszerűen lekérik az llms.txt-t, amikor egy dokumentációs oldalra irányítják őket. Ez egy „business-to-agent” (B2A) felület: az első szabványos mód arra, hogy a márkája gépi olvasásra szánt, tiszta felületet publikáljon, amelyre az AI-ágensek rá tudnak állni.

Az llms.txt 2026-ban olcsó, alacsony hozamú fogadás — de tiszta opcióval a jövőre. Nem azért érdemes elkészíteni, mert holnap megduplázza az idézettségét, hanem mert infrastruktúra a webhez, amerre tart.

Hogyan csinálja jól

  • Készítse el — de reális elvárásokkal. Olcsó, gyors, és nem árt. SEO-csodát viszont ne várjon tőle.
  • Tartsa frissen. A kézzel írt fájlok gyakori betegsége a „poshadás”: 404-es linkek, régi terméknevek. Egy elavult llms.txt rosszabb, mint a semmi.
  • Hangolja össze a robots.txt-vel. A két fájl ne mondjon ellent egymásnak — egyetlen, koordinált csomagként kezelje őket.
  • WordPressen a Yoast SEO és a Rank Math is tud llms.txt-t generálni kódolás nélkül.

A 10 perces öndiagnózis

Mielőtt bárkit felbérelne, ezt a négy lépést maga is elvégezheti még ma:

  1. 1 Forrás-teszt. Nyissa meg a legfontosabb oldalát, jobb klikk → „Forrás megtekintése”. Megtalálja a fő szövegeit? Ha nem, JavaScript-csapdában van.
  2. 2 PDF-teszt. Próbálja kijelölni a szöveget a legfontosabb PDF-jében. Ha nem megy, a botok sem olvassák.
  3. 3 robots.txt-teszt. Ellenőrizze, nem tiltotta-e le véletlenül a GPTBot, ClaudeBot vagy PerplexityBot hozzáférését. (Tudatos kizárás rendben van — a véletlen nem.)
  4. 4 Szakéma-teszt. A forráskódban ott a JSON-LD strukturált adat? Ha csak renderelés után jelenik meg, a bot nem látja.

Gyakori kérdések

Ha jól rangsorolok a Google-ben, akkor az AI is lát, nem?

Nem feltétlenül. A Googlebot lefuttatja a JavaScriptet, az AI botok többsége (GPTBot, ClaudeBot, PerplexityBot) viszont nem. Ezért lehet egy oldal a Google első helyén, miközben a ChatGPT vagy a Claude számára gyakorlatilag üres. A jó Google-helyezés szükséges, de nem elégséges feltétele az AI-láthatóságnak.

Az AI botok renderelnek JavaScriptet 2026-ban?

A keresőcélú AI botok (GPTBot, ClaudeBot, PerplexityBot) jellemzően nem. Csak a nyers HTML-t töltik le. A Vercel és a MERJ több mint félmilliárd GPTBot-lekérésre kiterjedő vizsgálata nulla JavaScript-futtatást talált. A botok le-letöltik a JS-fájlokat, de nem futtatják őket. Egyedül a Googlebot renderel teljeskörűen, a Bing pedig részben.

Tényleg szükségem van llms.txt fájlra?

Érdemes elkészíteni, de reális elvárásokkal. A keresőcélú AI botok ma még jórészt figyelmen kívül hagyják, és a vizsgálatok nem mértek tőle kimutatható SEO-előnyt. Az igazi haszna az ágensalapú webben van: a kódoló és kutató AI-ágensek (Cursor, Claude Code, Copilot) rutinszerűen lekérik. Olcsó, gyors, és nem árt — viszont tartsa frissen, mert egy elavult fájl rosszabb a semminél.

Miért nem látják az AI botok a PDF-jeimet?

A szöveges PDF-ek általában olvashatók. A baj a szkennelt, képből álló PDF-ekkel és a titkosított vagy jelszavas dokumentumokkal van: előbbiből csak hibázó OCR-rel nyerhető ki szöveg, utóbbiból egyáltalán nem. Egyszerű teszt: ha a PDF szövegét nem tudja egérrel kijelölni, a bot sem tudja kiolvasni.

Mi az a „technikai adatadósság”?

Az a felgyülemlett, láthatatlan technikai teher — renderelésre váró JavaScript, lezárt dokumentumok, félrekonfigurált hozzáférés —, ami miatt egy egyébként értékes tartalom a generatív keresők számára nem hozzáférhető. Nem kreatív, hanem mérnöki probléma, ezért rendszerszinten orvosolható.

Nem a tartalom hiányzik. A láthatóság.

A jó hír, hogy a technikai adatadósságot fel lehet mérni és vissza lehet fizetni — gyakran sokkal gyorsabban, mint újabb húsz cikket megírni. Egy alapos AI-láthatósági audit megmutatja, pontosan hol esik ki a tartalma a botok látóköréből.

Az adatok forrásai (2026): Vercel & MERJ crawler-elemzés (JavaScript-renderelés); SE Ranking 300 000 domaines llms.txt-vizsgálat; Limy AI-bot forgalomelemzés; valamint független technikai SEO-auditok. Az értékek tájékoztató jellegűek és az AI-crawlerek viselkedésének változásával frissülhetnek.

Miért akarnak ilyen sokan velünk dolgozni?

Az onlinemarketing101.biz SEO ügynökség arra törekszik, hogy vállalkozásod online jelenlétét a csúcsra emelje. Weboldalunkon minden információt megtalálsz a keresőoptimalizálási szolgáltatásainkról és a kapcsolódó árakról, amelyek egyszerűvé és átláthatóvá teszik a döntéseidet. Akár a legújabb digitális marketing trendekben rejlő lehetőségeket szeretnéd kihasználni, akár márkád ismertségét növelnéd, nálunk a megoldás kéznél van. Nézd meg legújabb tartalmainkat, és ismerd meg, hogyan segíthetjük vállalkozásod fejlődését az online térben.

5-stars