See on küsimus, mida oleks kõige parem teha, kui Google indekseerib lehti, mida tegelikult pole.

Mul on uudislehtede komplektis, kus failile viidatakse, üsna lihtne lehitsemise süsteem news.php?page=X.

Määran oma Google'i saidikaardil seda tüüpi kehtivate lehtede koguarvu (praegu kuni news.php?page=13).

Ekraanil kuvatav lehekülg on tavaline paigutus "1,2,3 ... Järgmine / Eelmine".

Google Search Console paljastab siiski, et jälgib selles vormingus 14 846 lehte. Näiteks, news.php?page=7556 ja teised sarnased ilmuvad otsingutulemitesse.

Kuidas lehitsemine töötab, news.php?page=7556 näitab sama sisu mis news.php?page=13. Ehk siis vanimad vähesed uudised. Ütlematagi selge, et kusagil pole ühtegi linki ühelegi uudislehele peale 1-13.

Ma ei tea kindlalt, kas see mõjutab otsingut negatiivselt, kuid ma ei tahaks, et seaduslik sisu kannataks.

Niisiis, minu küsimus on, mis on parim viis peatada Google'i tuhandete lehtede indekseerimine? Kas peaksin lihtsalt looma 404 või 301 ümbersuunamise igale lehele, mis ei sisalda seaduslikku sisu? Kui peaks 301 ümbersuunamise suunama, milleks ta peaks ümber suunama?

Uuendatud esmaspäeval, 13. novembril:

Nagu soovitas Ilmari Karonen, olen lisanud lehe päistesse rel = canonical, nii et uudiste news.php? Page = 7556 taotlus näitab, et kanooniline URL on news.php? Page = 13.Ma pole praegu 404 vealehele lisanud 301 ümbersuunamist ega ümbersuunamist. Ma jälgin tulemusi Search Console'is ja annan teada kõigest kasulikust.

Kui nendel URL-idel pole seaduslikku sisu, tagastage lihtsalt olek 404. Selleks see ongi.

Samuti võiksite oma skripti HTML-väljundisse lisada rel = kanoonilise lingi, veendumaks, et mis tahes muu ootamatu URL-i manipuleerimine (näiteks täiendavate URL-i parameetrite lisamine) ei too kogemata otsingumootori indeksitesse dubleerivat sisu.


Soovi korral võite teha ka 301 ümbersuunamise kanoonilisele URL-ile, kui tuvastate, et teie skriptile pääses juurde mõne muu URL-i kaudu, kuid SEO-l pole selle tegemisel tõelist eelist. Kui aga sina oodata et mingil põhjusel võivad teie kasutajad regulaarselt sattuda samale lehele mitme erineva URL-i kaudu, siis 301 ümbersuunamise seadistamine aitab tagada, et teie kasutajad kasutavad neid kanoonilisi URL-e alati järjehoidjates ja linkides.

(Näiteks kasutab Stack Exchange mõlemat meetodit: teie küsimuse URL ja minu vastuse URL-id on erinevad, kuid viimaselt esimesele on rel = kanooniline link. Teisalt, kui SE tuvastab, et URL-i nälkjas ei vasta küsimuse pealkirjale, see suunab 301.)


Ps. Teie kirjelduse põhjal tundub, et teie lehe otsimine on seadistatud nii, et iga kord, kui uus üksus lisatakse, kuvatakse see 1. lehe ülaosas ja iga lehe viimane üksus lükatakse järgmisele lehele. Sellise skeemi probleem on see, et nende registri ajakohasena hoidmiseks peab Google uuesti indekseerima kõik oma lehed iga kord, kui uus üksus lisatakse. Kui nad ei tee seda piisavalt kiiresti, võite lõpuks mõne elemendi täielikult Google'i indeksist puududa ja mõned ilmuda kaks korda või kui Google'i tulemused näitavad lehti, mis tegelikult ei sisalda enam kasutaja otsitavat üksust.

Kuni igal teie uudisel on oma stabiilne kanooniline URL, kusjuures lehtedega loend toimib ainult kataloogina ja lingib stabiilsete üksuste URL-idega, pole see tegelikult suur probleem. (Näiteks töötab Stack Exchange'i küsimuste loend niimoodi ja Google saab sellega suurepäraselt hakkama.) Tegelikult võiksite sellisel juhul isegi kaaluda robotite metamärgendi "noindex" lisamist loendilehtedele (või vähemalt kõik peale esimese lehe), et julgustada Google'i saatma külastajad selle asemel otse üksuste lehtedele.

Kui aga teie uudised ainult ilmuvad nummerdatud loendilehtedele, siis peaksite tõesti kaaluma oma saidi ümberkujundamist nii, et igal üksusel oleks üks ja kindel URL. See muudab palju tõenäolisemaks, et Google indekseerib teie uudised õigesti ja et külastajad, kes teie saidile Google'i tulemustest tulevad, leiavad tegelikult selle, mida nad otsisid.

  • "Valikuliselt võite teha ka 301 ümbersuunamise" - kuna need ekslik URL-id näivad olevat otsingumootorite poolt indekseeritud. Ma arvan, et see pole enam "valikuline". See on nüüd kohustuslik SEO säilitamiseks. Nende juba indekseeritud lehtede 404 tagastamine oleks SEO-le kahjulik. (Kuigi 404 oleks vaieldamatult õige asi, mida alguses oleks pidanud tegema - enne nende lehtede indekseerimist.)
  • @MrWhite: Ainult siis, kui nad on lingitud teistelt saitidelt või kui nad tõrjuvad välja SERP-ide õigustatud tulemused (ja te ei saa endale lubada lihtsalt oodata, kuni Google 404-d üles võtab). Nende käsitsi eemaldamine Google'i registrist Webmaster Tools'i kaudu (pärast 404s seadistamine) oleks ka võimalus, ehkki antud juhul võib-olla mõnevõrra tüütu. Ilmselt on keegi siiski selle poolautomatiseerimiseks teinud Chrome'i laienduse.
  • 2 A 301 ümbersuunamine on püsiv, seega ei tohiks seda siin kasutada. Kuigi ?page=30 on praegu sama mis ?page=13, see pole tulevikus enam nii (pärast seda, kui rohkem postitusi avaldati).
  • @unor: 301 ei ole enesetapupakt ja Google tegeleb 301 sihtmärgi muutmisega sama hästi kui muude lehe oleku muutustega. See tähendab, et ma ei näe ka sel juhul reaalset mõtet 301 (või mõne muu) ümbersuunamise kasutamisel, vähemalt kui te ei kahtlustagi, et need olematud lehed saavad kuidagi märkimisväärse arvu kuskilt saabuvaid linke. Mis tundub ebatõenäoline.

Peate käitama teatud tüüpi skripti, mis genereerib talle antud lehenumbri põhjal andmeid. Kurb tõde on see, et kes skripti kujundas, ei arvestanud vigu tõsiselt.

Skripti tuleb redigeerida nii, et kui määratud lehenumber ületab teie saidi jaoks tehtud tegelike lehtede koguarvu (13?), Siis peaks ideaalseks väljundiks olema HTTP tõrge 404, mis näitab, et lehte ei leita, kuid kuna Google on juba proovis selliseid väljamõeldud lehti indekseerida, siis tuleb HTTP veakood muuta veaks 410, et öelda Google'ile, et lehte ei leitud, ja lõpetada selle konkreetse lehe skannimine.

Kui teil on põhiline programmeerimiskogemus, saate selle probleemi ise parandada. Vastasel juhul peate võtma ühendust nende probleemide jaoks kasutatava skripti arendajatega ja seejärel peaksite hankima uue skripti, mis asendab teie skripti, mis töötab teie veebisaidi ülesandega õigesti.

Ma ei soovitaks väljamõeldud lehtede jaoks ümbersuunamist (301 või 302), kuna väärtust ei pakuta ning see aeglustab ka serverit, kuna otsingurobotid skannivad nii väljamõeldud lehtede numbreid kui ka uusi URL-e, kuhu nad suunatakse , aga kui arvate, et külaline võib proovida pääseda väljamõeldud numbrile, siis võiksite lisada vealehele lingi kehtivale lehele.

none: Charles Robertson | none