Google Search Console'i ​​õpetus - 9. osa | Uute eemaldamistööriistade mõistmine Hindi keel

Olen kasutanud nii palju asju nagu URL-i eemaldamistaotlus ja kustutanud lehed jne, kuid siiski kuvatakse vead minu veebimeistri tööriistades.

Kuidas ma saan URL-id Google'ist täielikult eemaldada?

Võite: lehe või saidi Google'i otsingutulemitest eemaldada, kuid see võtab aega, enne kui see mõjutab.

  • Olen taotlenud kataloogi eemaldamist veebimeistrite paneeli kaudu. Kui kaua kulub selle läbimiseks? Samuti olen keelanud kataloogi faili robots.txt kaudu.

Üldiselt ei saa. Kuid on mõned võimalused.

Üks võimalus on eemaldada lehed oma serverist täielikult ja veenduda, et need vastaksid 404 veaga.

Teine on kasutada robots.txt faili, et Google ei saaks sisu roomata. See hoiab kindlasti ära uute lehtede indekseerimise, kuid võib kuluda mõni aeg, kuni olemasolevaid lehti enam ei kuvata.

Viimane võimalus on kasutada noindex metasilt.

Lisateavet leiate selle teema kohta Google'i lehelt: http://www.google.com/support/webmasters/bin/answer.py?hl=et&answer=164734

Lühike vastus praktilisuse kontekstis: sa ei saa.

Mida sa saab Eemaldage linkid, mis neile osutavad, ja veenduge, et lehed vastaksid 404 olekukoodiga, ja kui Google näeb, et lehti pole enam olemas, puhastavad nad need lõpuks tulemustest.

  • Nii peakski olema 410 Gone mitte 404 Not Found

Kui teie saidil on Gooogle'is indekseeritud lehti, mille soovite eemaldada, peate kõigepealt oma saidi muutma. Võite kas eemaldada lehed, blokeerida Googleboti nende vaatamise või lisada nendesse sildi, mis käsib Google'il neid mitte indekseerida.

  • 410 läinud - 410 olekuga lehtede eemaldamine võimaldab Googlebotil need indeksist eemaldada kohe, kui see neid järgmine kord indekseerib.
  • 404 ei leitud - Googlebot eemaldab 404 URL-i pärast 24-aastast lisaaega, kui ta neid järgmisel korral indekseerib.
  • noindexi silt - Kui leht on saidil endiselt saadaval, kuid seda ei tohiks indekseerida, lisage <meta name='robots' content='noindex'> aastal <head> jaotises. Google eemaldab selle indeksist järgmisel korral, kui indekseerib.
  • Paroolikaitse - Kaitske teavet, nõudes sellele juurdepääsemiseks sisselogimist või parooli. Google võib sel juhul URL-i indekseerida, kuid see ei saa sisu indekseerida.
  • Keela failis robots.txt - Lisamise abil saate blokeerida Googleboti lehtedel indekseerimise Disallow: /mypage failis robots.txt. Google ei indekseeri tavaliselt lehti, mida ta ei saa indekseerida, ja ei indekseeri kunagi nende sisu. Kuid mõnikord võib Google URL-i otsingutulemites näidata ilma ühtegi juppi:

    Kui olete lehe eemaldanud või lisanud a noindex märgend, on oluline, et lubate Googlebotil lehte roomata. Kui keelate ka sisse roomamise robots.txt, Googlebot ei näe, et teie leht tuleks eemaldada. Ärge keelake lehti robots.txt kui olete sellest loendist kasutanud ka mõnda muud meetodit.

Kõigi nende meetodite korral peab Googlebot enne nende eemaldamist naasma ja roomama. See protsess võib kuluda paar kuud, eriti paljude lehtede jaoks, mis pole eriti populaarsed. Kui soovite protsessi kiirendada, logige sisse Google Search Console'i ​​ja kasutage iga URL-i jaoks funktsiooni Fetch as Google. Pange tähele, et see on käsitsi protsess, mille kvoot on kümme tõmbamist päevas, nii et see ei tööta suure hulga URL-ide korral.

Google'il on Search Console'is ka tööriist URL-ide eemaldamine, mis seda saab ajutiselt eemaldage URL-id või kataloogid Google'ist 90 päevaks. Selle tööriista abil saate URL-id otsingutulemitest kiiresti eemaldada, enne kui Googlebotil on võimalus neid roomata.

Isegi pärast URL-ide eemaldamist Google'i otsingutulemitest võib Google siiski näidata URL-e vigadena Google Search Console'is. Niikaua kui Google leiab linke URL-idele, võidakse neid kuvada roomamisvigadena pärast nende oleku 404 või 410 olemasolu. See on täiesti normaalne ja ei kahjusta teie saidi teisi lehti üldse. Lisateabe saamiseks vaadake, mida Google'i John Mueller on roomamisvigade kohta öelnud.

URL-ide eemaldamiseks Google'i otsingumootorist on kaks võimalust

1. on

Kui te ei soovi oma lehte Google'is indekseerida, peate selle eemaldamise taotlemiseks kasutama Google'i veebimeistri tööriista URL-i eemaldamise tööriista Siin on see viis

  • Logige sisse oma veebimeistri tööriista
  • minge saidi konfiguratsioonile
  • minge roomiku juurdepääsule
  • minge vahekaardile Roomiku juurdepääs
  • kahjusta oma URL-i uues eemaldamistaotluses

mõne päeva pärast kustutatakse teie URL otsingumootorist ega saa roomata.

2

Kui teie saidil on sisu, millele te ei soovi, et Google või muud otsingumootorid pääseksid juurde, kasutage robots.txt ja lubage selle veebilehe kaust.

URL-ide eemaldamiseks Google'i otsingumootorist saate kasutada ühte ülaltoodud toimingut

Esiteks on Google'il suurepärane mälu. Nii et isegi kui teil õnnestub Google'il teie URL-id oma registrist välja visata, taotlevad nad neid URL-e tulevikus uuesti. Teie lähenemisviis peab arvestama mõlemaga.

Ma soovitaksin teil need sammud läbi teha

  1. Kasutage Google Search Console'i ​​eemaldamistööriista, et takistada Google'il teie URL-ide esilekutsumist. See on käsitsi esitatud taotlus, mille esitate Google'ile, mis tavaliselt varjab URL-id 24 tunni jooksul (kuid sageli varem). TEMPORARILY REMOVE URL. Pange tähele, et see tähendab ainult seda, et Google peidab oma URL-e 180 päeva jooksul, pole need veel päriselt kadunud (selle juurde jõuame hiljem).
  2. Teise vahekaardi abil tühjendage kindlasti kõik Google'i URL-ide vahemälud CLEAR CACHED URL Google Search Console'i ​​eemaldamistööriistas. Pärast 1. ja 2. toimingu tegemist ei kuva Google enam teie URL-e, sealhulgas vahemällu salvestatud versioone.
  3. Nüüd kogun teie postitusest, et olete lehed juba eemaldanud. Nii et sel juhul on kõige parem veenduda, et tagastate 410 Gone staatuse kood a asemel 404 Not Found. The 410 Gone saadab Google'ile palju tugevama signaali, et nad peaksid URL-i oma indeksist eemaldama. See on parem kui tagastada a 404 Not Found sest need on sageli juhuslikud.
  4. Eemaldage kõik siselingid, sissetulevad ümbersuunamised ja saabuvad kanoonilised lehed, mida soovite eemaldada. Peate lõpetama signaalide saatmise, mis näitavad, et URL tuleks Google'ile indekseerida (ja võib-olla indekseerida).
  5. Kui soovite hõlpsalt jälgida, kas Google võtab teie vihjeid üles, looge XML-i saidikaart, kus on loetletud kõik URL-id, mille soovite kaotada, ja esitage see Google Search Console'is. Eemaldage XML-i saidikaart pärast seda, kui Google on kõik URL-id edukalt oma indekseeritud lehelt eemaldanud.

Mida vältida

Vältige robots.txt-direktiivide rakendamist, et proovida Google'il URL-id oma indeksist eemaldada, sest kui nad on juba sisu indekseerinud, läheb neil URL-ide oma registrist välja viskamine päris kaua aega. Nad ei saa teie kohta järele tulla 410 Gone kas seetõttu, et takistasite neil sellele juurdepääsu.

Ka uute lehtede puhul, mis peaksid olema külastajatele juurdepääsetavad, ei ole soovitatav hoida Google'it selle indekseerimisega robots.txt kaudu. Parim on kasutada Noindexi robotite direktiivi (kas HTML-i allika või X-Robots-Tag HTTP päis).

Huvitav on see, et Google soovitab kasutada robots.txt-i, et panna neid oma indeksist pilte kukutama.

Lisateave URL-i eemaldamise kohta

Kui soovite süvitsi uurida URL-ide eemaldamist Google'ist, olen selle olukorra ja paljude teiste eemaldamisprotsessi üksikasjalikult dokumenteerinud aadressil https://www.contentkingapp.com/academy/google-remove-urls/.

none: Charles Robertson | none