SitemapScan Blog
Sitemapy .xml.gz: jak je audytować bez zgadywania
Sitemap .xml.gz może być URL setem, sitemap indexem albo skompresowanym child sitemapem. Samo rozszerzenie mówi prawie nic. Tak oceniasz go poprawnie.
Co naprawdę oznacza sitemap .xml.gz
Rozszerzenie .gz mówi tylko, że plik jest skompresowany. Nie mówi, czy XML w środku to URL set czy index.
Dlaczego skompresowane pliki prowadzą do błędnych założeń
Wiele osób traktuje skompresowany sitemap jako coś pobocznego, mimo że może to być główny indeks koordynujący cały ekosystem.
Jak poprawnie go sklasyfikować
Pobierz plik, rozpakuj go i sprawdź element główny. <sitemapindex> oznacza plik koordynujący inne sitemapy, a <urlset> końcowy inwentarz URL-i.
Related pages
- Sitemap index vs URL set: jak zobaczyć różnicę i dlaczego to ważne — Sitemap index i sitemap URL set nie pełnią tej samej roli. Rozpoznanie, z czym masz do czynienia, zmienia całą ocenę pokrycia i struktury.
- Błędy content-type sitemap: gdy plik istnieje, ale fetch nadal zawodzi — Niektóre URL-e sitemap istnieją i otwierają się w przeglądarce, ale mimo to nie przechodzą ważnych testów. Błędny content-type jest jedną z cichszych przyczyn.
- Wiele sitemap w robots.txt: co to znaczy i jak to audytować — Niektóre serwisy deklarują jedną mapę witryny w robots.txt, inne dwadzieścia. Oto co naprawdę oznaczają liczne dyrektywy Sitemap i jak poprawnie ocenić taką strukturę.
- Blog — Wskazówki, przewodniki i najlepsze praktyki dotyczące sitemap XML i technicznego SEO.