Meil on laiendatud utf-8 tähemärkidega hashbangi URL-id. Näiteks:

https://example.com/#!каталог 

Bing-bot tõmbab HTML-i hetktõmmise https://example.com?_escaped_fragment_=каталог kodeeritud URL-i kui \xD0\xB0.... Meie server vastas selle eest 400 veaga. Nad aktsepteerivad ainult protsentuaalselt kodeeritud URL-e. %D0%B0... saaks 200 OK oleku.

Kuidas seda probleemi lahendada?

näiteks:

  • Kas olete kindel, et see on tõeline Bingbot? Olen näinud (eraldi logides) paljusid halvasti kirjutatud roboteid, mis teesklevad end nt. Googlebot.
  • 1 pilt on lisatud [uuendatud]. IP-kontroll: dig.whois.com.au/ip/40.77.167.196
  • 1 kas see võiks olla omamoodi, kuidas su kiisu URL-idega hakkama saab, mitte?
+25

Enne mis tahes robotite jaoks indekseerimist peaksite pildi nime kodeerima, st pildi nimi peaks olema selline %2F%D0%B7%D1%83%D1%80%D0%B0%D0%B3.jpg oma lehe lähtekoodis. Kõik kaasaegsed brauserid dekodeerivad selle ja näitavad kasutajate jaoks UTF-8 tähemärke inimsõbralikult.

Niisiis, enne lähtekoodi lisamist tehke serveripoolne kodeerimine ja kodeerige kõik need märgid.

Vaadake selle Wikipedia lehe lähtekoodi ja saate aru: https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%BE%D0%B3%D1%80%D0%B0% D0% BC% D0% BC% D0% B0_% D1% 80% D0% B0% D0% B7% D0% B2% D0% B8% D1% 82% D0% B8% D1% 8F_% D0% 9E% D0% 9E% D0% 9D

Värskendus: veebisaidi ja teiste StackExchange'i kasutajate kommentaaride põhjalikuma ülevaate põhjal. Näib, et peate kodeerima kõik oma URL-id oma veebisaidil ja XML-i saidikaardil. Teie veebisaidil pole teil kodeeritud URL-e ega XML-i saidikaardil kodeeritud URL-e. Palun kasutage kõikjal UTF-8 kodeeritud URL-e. Pidage meeles, et Bingbot on Googleboti taga ja hakkas hiljuti JS-põhist veebisaiti laiemas plaanis muutma. Mitte-ASCII tähemärkide kasutamine võib Bingbotile põhjustada vigu.

Lähtekoodi ja DOM-i URL-id, samuti XML-i saidikaardil peavad olema teie näite põhjal kodeeritud järgmiselt:

https://example.com/#!%D0%BA%D0%B0%D1%82%D0%B0%D0%BB%D0%BE%D0%B3 

Siit saate lugeda lisateavet korraliku saidikaardi kodeerimise kohta: https://www.sitemaps.org/protocol.html#escaping

  • Arvate, et nad lingivad зураг.jpg pigem kui %D0%B7ураг.jpg ?
  • Jah, ma eeldan, et lähtekoodis on pildi nimi: зураг.jpg
  • 1 @ ts.tsogtgerel täname oma veebisaidi jagamise eest. Nüüd on kõik selge. Peamine küsimus on see, et teie veebisait on JS-is ja Bing on JS-i sisu renderdamisel ja JS-i põhise veebisaidi indekseerimisel äärmiselt uus. Google on JS-failide renderdamisel üsna arenenud ja näeb sisu üsna head, kuid Bing on siin algaja. Võib-olla saate oma meeskonnaga rääkida võimalusest oma sisu eelvormistada või midagi muud? Siin on JS-i renderdatud veebisaitide kohta üsna hea juhend. See teave annab teile selle teema kohta palju teavet.
  • 1 @ ts.tsogtgerel lisamärkus. Teie veebisaidil DOM näen, et teie URL-id pole samuti kodeeritud. Kuid teie puhul ei näe Bingi bot isegi teie sisu.
  • 1 "Põhiküsimus on see, et teie veebisait on JS-is" - JS-element võib takistada Bingil alustuseks saidi indekseerimist / indekseerimist, kuid see ei tohiks olla põhjus, miks Bing indekseerib valesti kodeeritud URL-id. (?) Muide, kodeerimata URL-id on olemas ka XML-i saidikaardil, mida ma arvan, et tõenäoliselt saadetakse Bingi veebimeistri tööriistadesse?

Tõenäoliselt peate seda tegema urlencode pilte src atribuut sisse HTML-märgendid.

  • 2 Seda peetakse madala kvaliteediga vastuseks. Kas saaksite oma mõtlemist rohkem selgitada ja lisada mõned üksikasjad? Oletame, et OP-l on vähe aimugi, millest te räägite. Terviseks !!

none: Charles Robertson | none