Feltérképezési keret (crawl budget) nagy oldalaknál - illusztráció

Feltérképezési keret (crawl budget) nagy oldalaknál

Frissítve: a nagy webhelyek feltérképezési keret kezelésének 2026-os gyakorlatával. (frissítve: )

Összefoglaló

  • A feltérképezési keret (crawl budget) az az erőforrás, amelyet a kereső a webhelyed feltérképezésére szán - a feltérképezési kereslet és a kapacitás közös eredménye.
  • A legtöbb kis és közepes webhelynél nem szűk keresztmetszet; igazán a több tízezer vagy több százezer URL-es oldalaknál számít.
  • A keretet a duplikált, alacsony értékű és hibás URL-ek pazarolják el; a megoldás a szerkezet tisztítása, nem a keret mesterséges növelése.

Mi a feltérképezési keret (crawl budget)?

A feltérképezési keret az az erőforrás-mennyiség, amelyet a kereső egy adott időszakban a webhelyed feltérképezésére fordít. Két tényezőből áll: a feltérképezési kapacitásból (mennyit bír el a szervered lassulás nélkül) és a feltérképezési keresletből (mennyire tartja a kereső fontosnak és frissnek az oldalaidat). A kettő együtt határozza meg, hány URL-t és milyen gyakran térképez fel a robot.

Fontos tisztázni: a feltérképezési keret nem rangsorolási tényező. Attól, hogy egy oldalt gyakrabban térképez fel a robot, még nem kerül előrébb a találatokban. A keret arról szól, hogy a fontos oldalaid egyáltalán és időben bekerülnek-e a feldolgozásba - különösen igaz ez a gyakran változó tartalmaknál.

A Google maga is jelezte, hogy a legtöbb webhelynek nem kell foglalkoznia a feltérképezési kerettel. Ha néhány száz vagy néhány ezer oldalad van, a robot gond nélkül eljut mindenhová. A téma ott válik igazán fontossá, ahol az URL-ek száma tízezres vagy százezres nagyságrendű.

A feltérképezési kereslet és a feltérképezési kapacitás oszlopdiagramon
A feltérképezési keret a kereslet és a kapacitás közös eredménye.

Kinek számít valójában a feltérképezési keret?

A feltérképezési keret elsősorban a nagy webhelyeknél szűk keresztmetszet. Egy néhány tucat oldalas bemutatkozó weboldalnál gyakorlatilag sosem az. A határ nagyjából ott húzódik, ahol a webhely szerkezete olyan bonyolulttá válik, hogy a robot nem tud minden fontos oldalt kellő gyakorisággal meglátogatni.

  • Nagy webshopok több tízezer termék-, kategória- és szűrő-URL-lel.
  • Hírportálok és nagy blogok, ahol naponta sok új és frissülő oldal keletkezik.
  • Adatbázisból generált oldalak (állások, ingatlan, katalógusok) sok paraméterrel.
  • Régi, elhanyagolt webhelyek rengeteg elavult vagy törött URL-lel.

A közös bennük, hogy sok URL-t termelnek, amelyek jelentős része alacsony értékű vagy duplikált. Ilyenkor a robot a keret nagy részét felesleges oldalakra pazarolja, a fontosak pedig ritkábban frissülnek az indexben. A fenti ábra épp ezt a torzulást szemlélteti a keret két összetevőjén keresztül.

Feltérképezési kereslet és kapacitás

A feltérképezési kapacitás azt jelzi, mennyi kérést bír el a szervered anélkül, hogy lelassulna vagy hibázna. Ha a szerver gyors és stabil, a kereső bátrabban térképez; ha lassú vagy sokszor hibázik, a robot visszafogja magát, hogy ne terhelje túl. A gyors, megbízható tárhely tehát közvetve tágítja a keretet.

Mi növeli a feltérképezési keresletet?

A kereslet oldalt az dönti el, mennyire tartja a kereső fontosnak és frissnek a tartalmadat. A népszerű, sokat hivatkozott és gyakran frissülő oldalakat a robot sűrűbben látogatja. Ezzel szemben a régóta változatlan, kevés hivatkozású oldalak keresletet veszítenek, és ritkábban kerülnek sorra.

Ebből következik a legfontosabb tanulság: a keretet nem közvetlenül állítod, hanem közvetve befolyásolod. Gyors szerverrel a kapacitást, értékes és jól hivatkozott tartalommal pedig a keresletet emeled - és a kettő együtt adja a valós feltérképezést.

Mi pazarolja el a feltérképezési keretet?

A keret pazarlásának legfőbb forrása a felesleges URL-ek tömege. Ezek olyan címek, amelyeket a robot feltérképez, de nincs önálló értékük, vagy megegyeznek egy másik oldallal. Minél több ilyen URL-t talál a robot, annál kevesebb erőforrás jut a valóban fontos oldalakra.

  • Szűrő- és rendezési paraméterek végtelen kombinációi (szín, méret, ár szerinti sorrend).
  • Munkamenet-azonosítók és követőparaméterek az URL-ben.
  • Duplikált tartalom kanonikus jelölés nélkül (például www és nem-www változatok).
  • Végtelen naptárak, lapozás nélküli listák és automatikusan generált üres oldalak.
  • Sok átirányítási lánc és lassú, hibázó (5xx) válaszok.

Ezek együtt olyan URL-tömeget hoznak létre, amelyet a robot végigjár, mielőtt a fontos oldalakhoz érne. A fenti trendábra jól mutatja, hogyan vonják el a duplikált és alacsony értékű címek a keretet - és hogy a tudatos tisztítással ez az arány visszaszorítható.

A pazarló URL-típusok arányának alakulása időben trendvonalon
A duplikált és alacsony értékű URL-ek elvonják a keretet a fontos oldalaktól.

Hogyan segítsd a keresőt a fontos oldalaknál?

A cél nem a keret növelése, hanem a hatékony felhasználása: a robot a fontos oldalakra költse az erőforrást, ne a feleslegesekre. Ehhez a webhely szerkezetét kell tisztán tartani, és egyértelmű jelzéseket adni arról, mi fontos és mi nem. A legtöbb lépés egyszerre javítja a feltérképezést és a felhasználói élményt is.

A leghatásosabb lépések a gyakorlatban

  • Kanonikus címkével jelöld meg a duplikátumok elsődleges változatát.
  • A robots.txt-ben zárd ki a feltérképezésből az értéktelen paraméteres URL-eket.
  • A noindex a keretet nem óvja meg (a robot előbb letölti), ezért a felesleges URL-ek keletkezését állítsd le.
  • Javítsd a törött hivatkozásokat és rövidítsd le az átirányítási láncokat.
  • Tartsd a fontos oldalakat kevés kattintásra a főoldaltól, erős belső linkeléssel.

A fenti ábra a hatékony feltérképezés rétegeit mutatja: a tiszta szerkezet a központból kifelé egyre jobban vezeti a robotot a fontos tartalomhoz. Minél kevesebb zsákutca és felesleges elágazás van, annál nagyobb hányad jut a valódi értékre.

A feltérképezés optimalizálásának lépései koncentrikus körökkel
A tiszta szerkezet a központból kifelé egyre hatékonyabb feltérképezést épít.

robots.txt, noindex vagy kanonikus - mikor melyik?

Sokan összekeverik ezt a három eszközt, pedig más-más a szerepük. A robots.txt megtiltja a feltérképezést, tehát a robot le sem tölti az adott URL-t - ez óvja a keretet, de a már indexelt oldalt nem távolítja el. A noindex ezzel szemben engedi a letöltést, csak az indexelést tiltja, ezért a keretet nem védi meg.

A kanonikus címke a duplikátumok kezelésére való: megmondja a keresőnek, melyik változat az elsődleges. Ha egy paraméteres URL egyszerű duplikátum, a kanonikus a jó választás; ha viszont teljesen felesleges, végtelen kombináció, akkor a keletkezését érdemes megakadályozni vagy a robots.txt-ben kizárni.

A gyakorlati sorrend tehát: előbb a felesleges URL-ek keletkezését állítsd le, aztán a megmaradt duplikátumokat kanonizáld, és csak indokolt esetben nyúlj a robots.txt tiltáshoz. A noindexet a keret miatt sosem használd - arra való, hogy egy oldal ne jelenjen meg a keresőben, nem arra, hogy a robotot távol tartsd.

Naplóelemzés: mit csinál valójában a robot?

A legpontosabb kép a szerver naplófájljaiból (log) derül ki, mert ezek megmutatják, mely URL-eket, milyen gyakran és milyen válaszkóddal térképezett fel a robot. Ebből kirajzolódik, hogy a keret mekkora hányada megy felesleges oldalakra, és hol vannak a hibázó vagy lassú kérések. A naplóelemzés így a feltérképezés valós, nem feltételezett képét adja.

A Search Console feltérképezési statisztikái is sokat elárulnak: a napi kérések száma, az átlagos válaszidő és a válaszkódok megoszlása jó kiindulópont. Ha az 5xx hibák aránya nő, vagy a válaszidő romlik, az a kapacitás szűkülésének jele. Ilyenkor a szerver teljesítményén érdemes javítani, mielőtt a tartalmi munkába kezdenél.

Kis webhelynél is foglalkozzak vele?

Egy néhány tucat vagy néhány száz oldalas webhelynél a feltérképezési keret szinte sosem szűk keresztmetszet, ezért nem kell rá külön energiát fordítani. A robot bőven eljut minden fontos oldalra. Ilyenkor a tartalom minőségére és a belső szerkezetre érdemes figyelni, nem a keretre.

Ez viszont nem jelenti azt, hogy a tisztaság ne számítana. A törött hivatkozások, a duplikátumok és a felesleges paraméterek elkerülése kis oldalnál is jó gyakorlat, mert egyszerűbb, karbantarthatóbb webhelyet ad. A keret így nem lesz probléma akkor sem, ha a webhely idővel nagyra nő.

Hogyan mérd a feltérképezés hatékonyságát?

A feltérképezés hatékonyságát több jelből olvashatod ki. Az egyik, hogy a fontos, frissen módosított oldalaid milyen gyorsan frissülnek a keresőben. A másik, hogy a feltérképezési statisztikákban mennyi kérés megy valós, értékes URL-ekre a felesleges címekhez képest. A cél ennek az aránynak a folyamatos javítása.

Figyeld emellett a válaszkódok megoszlását és az átlagos válaszidőt is, mert ezek a kapacitás állapotát mutatják. Ha a fontos oldalak gyorsan frissülnek, és kevés kérés megy zsákutcákba, a keret hatékonyan hasznosul. Ne egyetlen napot nézz, hanem a több hetes tendenciát, mert az mutatja a valódi irányt.

Mikor érdemes szakértőt bevonni?

Ha a webhelyed több tízezer URL-t termel, és a fontos oldalak lassan vagy egyáltalán nem frissülnek az indexben, valószínűleg feltérképezési keret gond áll a háttérben. Egy technikai keresőoptimalizálás szakértő a naplóelemzésből pontosan megmutatja, hová megy a keret, és mely URL-tömeget kell először visszaszorítani. Ez a munka gyakran nagyobb hatású, mint bármelyik tartalmi finomítás.

Cégünk a nagy webhelyek feltérképezési kereten alapuló problémáit a szerkezet és az üzemeltetés felől közelíti: tiszta URL-rendszert, gyors kiszolgálást és erős belső linkelést építünk. Így a robot a fontos oldalakra költi az erőforrást, nem a zsákutcákra.

Ajánlott forrás: a Google fejlesztői útmutatója a feltérképezési keret kezeléséről.

Összegzés: a feltérképezési keret helyes kezelése

A feltérképezési keret a feltérképezési kereslet és a kapacitás közös eredménye, és nem rangsorolási tényező. A legtöbb kis és közepes webhelynél nem szűk keresztmetszet - igazán a több tízezer vagy több százezer URL-es oldalaknál számít, ahol a fontos tartalom időben frissülése a tét.

A keretet nem növelni kell, hanem hatékonyan felhasználni: állítsd le a felesleges URL-ek keletkezését, kanonizáld a duplikátumokat, javítsd a törött hivatkozásokat, és tartsd a fontos oldalakat kevés kattintásra. A robots.txt óvja a keretet, a noindex nem, a kanonikus pedig a duplikátumok kezelésére való - a három eszköz szerepét ne keverd össze.

A valós képet a naplóelemzés és a feltérképezési statisztikák adják: ezek mutatják, hová megy a keret és hol lassul a kapacitás. Ha nagy webhelyet üzemeltetsz, és a fontos oldalaid lassan frissülnek, egy technikai átvizsgálás megmutatja, mely URL-tömeget kell először visszaszorítani.

Gyakran ismételt kérdések

A feltérképezési keret rangsorolási tényező?

Nem, a feltérképezési keret nem befolyásolja közvetlenül a rangsorolást. Attól, hogy egy oldalt gyakrabban térképez fel a robot, még nem kerül előrébb a találatokban. A keret arról szól, hogy a fontos oldalaid egyáltalán és időben bekerülnek-e a feldolgozásba, ami különösen a gyakran változó tartalmaknál számít.

Honnan tudom, hogy nekem probléma-e a feltérképezési keret?

A legtöbb kis és közepes webhelynél nem az, ezért ha néhány száz vagy néhány ezer oldalad van, valószínűleg nem kell vele foglalkoznod. Akkor válik fontossá, ha több tízezer URL-ed van, és a fontos, frissen módosított oldalak lassan vagy egyáltalán nem frissülnek az indexben. A Search Console feltérképezési statisztikái és a szerver naplói adják a legpontosabb választ.

A noindex megvédi a feltérképezési keretet?

Nem, a noindex csak az indexelést tiltja, a feltérképezést nem: a robot előbb letölti az oldalt, és csak utána látja a noindexet. Ezért a keret szempontjából nem hoz megtakarítást. Ha az a cél, hogy a robot le se töltsön egy értéktelen URL-t, arra a robots.txt tiltás vagy a felesleges URL-ek keletkezésének megakadályozása a helyes eszköz.

Mi pazarolja el leginkább a keretet egy webshopnál?

Jellemzően a szűrő- és rendezési paraméterek végtelen kombinációi, a munkamenet-azonosítók és a kanonizálatlan duplikátumok. Ezek olyan URL-tömeget hoznak létre, amelyet a robot végigjár, mielőtt a fontos termék- és kategóriaoldalakhoz érne. A megoldás a paraméteres URL-ek kizárása, a duplikátumok kanonizálása és a felesleges címek keletkezésének leállítása.

Segít a webhelytérkép a feltérképezésben?

A webhelytérkép segíti a fontos URL-jeid felfedezését, de nem növeli a feltérképezési keretet, és nem garantálja az indexelést. Csak indexelhető, kanonikus URL-eket soroljon fel, és tükrözze a webhely valós szerkezetét. Egy jó sitemap tehát hasznos kiegészítő, de nem pótolja a tiszta URL-rendszert és az erős belső linkelést.

Mit tegyek, ha a szerverem lassú a robotnak?

A lassú vagy sokszor hibázó szerver miatt a kereső visszafogja a feltérképezést, hogy ne terhelje túl, ami szűkíti a kapacitást. Érdemes a tárhely teljesítményén javítani, a válaszidőt csökkenteni és az 5xx hibákat megszüntetni. A gyors, stabil kiszolgálás közvetve tágítja a keretet, ezért ez sokszor a leggyorsabb megtérülő lépés.

Kapcsolódó szolgáltatások

Varga Réka - Keresőoptimalizálási és tartalomszakértő
Szerző Varga Réka Keresőoptimalizálási és tartalomszakértő

Varga Réka keresőoptimalizálási és tartalomszakértő, tíz éve foglalkozik google seo stratégiával, tartalomfejlesztéssel és a modern AI-keresőkre (GEO) való felkészítéssel. Cégünk seo- és tartalomcsapatának vezetője, aki a technikai alapoktól a citálható tartalomig kézben tartja a teljes folyamatot.

A szerző összes cikke
Olvass tovább

További cikkek