Papyrus VS Bandits - animatsioon (Megatale 1. osa)

Mul on probleeme veebisaidiga, mille kallal töötan. Esialgu seadistasin faili robots.txt, et vältida robotite indekseerimist selle töötamise ajal. Nüüd on selle reaalajas ja robots.txt fail kustutatud, kuid seda pole ikka veel indekseeritud ja see näitab, et robotitel on juurdepääs keelatud. Isegi faili robots.txt puudumisel. Sait on WordPressil põhinev veebisait - kõik näib viitavat sellele, et ühtegi indekseerijat ei tohiks blokeerida.

Otsingu käivitamine site:claimsadvicecentre.co.uk peaks üles tooma vähemalt 5 lehte, kuid selle ainus avaleht.

Mis siin viga võiks olla?

  • 2 Google'i veebimeistri tööriistad sobivad teie saidi roomamisega seotud probleemide kohta tagasiside andmiseks: google.com/webmasters
  • Mis juhtub .htaccess-failis - teie robotifail näeb välja ok.
  • Alustuseks ei tohiks olla robotifaili.
  • 1 see seal. kustutage see lihtsalt oma saidi juurest, võite lihtsalt jätta tühja koha, siis see ei tekita 404 väidetavat advicecentre.co.uk/robots.txt
  • OMG! Vandusin, et kustutasin selle oma FTP-st ...

Siiani ei tundu miski kohe vale. Selle asemel näivad mõned teie eeldused valed.

Esiteks küsimused.
Kui ütlete: "aga see [] näitab, et robotid on keelatud", millele viidatakse "sellele"?

Kui kaua on robotifaili kustutanud? See ei muuda midagi enne, kui teid uuesti roomatakse.

Nüüd soovitab teie otsingu näide teile omama vähemalt mingil määral indekseeritud. Kuid see ei tähenda, et mootorid otsustaksid kõik teie lehed tasuvad tegelikult otsingutulemitena naasta.

Peale selle otsib site: operaator ei tagasta tingimata kõike saidi jaoks indekseeritud, vaid ainult valiku. Kui peate tegelikult teadma, kui hästi teie saiti on roomatud, saate selle teabe Webmaster Toolsist.

  • Ma arvan, et selle kustutamisest on möödas juba peaaegu 5 päeva. Kui ma seda mõtlen, siis pean silmas saidi pretensioonid: advicecentre.co.uk tulemusi.
  • Paistab, et robots.txt on endiselt paigas pretensioonid advicecentre.co.uk/robots.txt
  • Laadisin lihtsalt teise robots.txt uuesti üles - ei saa kogu elu aru, kuidas see fail ikkagi pärast kustutamist seal oleks

Nii et robotifail näib endiselt olevat, kuid kood on muutunud, kuna vaatasin seda kõigepealt, mida see nüüd näitab: -

User-agent: * Allow: / 

Kuid selleks lubada kõiki, see peaks olema (mis see täna hommikul oli)

User-agent: * Disallow: 

Veel näiteid leiate robotite välistamise standardi wiki artiklist.

Kas võib olla, et üks teie WordPress-pistikprogrammidest genereerib automaatselt robotifaili?

Kui soovite kõik ühendada üheks suureks vastuseks, peate tegema järgmist.

  1. Veenduge, et teie robots.txt oleks õige. See peaks välja nägema, kui soovite, et indekseerijad indeksiksid kõik teie saidil:

    Kasutaja agent: *
    Keela:

    Pange tähele, et Lubama ei ole kõik roomikud ametlikult toetatud (Keela on üldtunnustatud väli).

  2. Looge XML-i saidikaart, mis loetleb teie saidi lehed. Saate seda teha käsitsi või kasutada automaatset generaatorit.
  3. Registreerige oma sait Google Webmaster Toolsis.
  4. Esitage oma XML-i saidikaart Google Webmaster Toolsile.

Kui olete need toimingud lõpule viinud, on teie sait indekseerimisega hästi kursis.

none: Charles Robertson | none