De ce este Dificil să Fiți Indexat de Google

poza de prezentare de ce este dificilă indexarea google

Fiecare site se bazează într-o oarecare măsură pe Google. Este simplu: unele pagini de pe site-ul dvs. sunt indexate de Google, ceea ce face posibil ca oamenii să vă găsească. Așa ar trebui să meargă lucrurile.

Cu toate acestea, multe pagini nu sunt niciodată indexate de Google.

Dacă lucrați cu un site web probabil ați observat că nu fiecare pagină de pe site-ul dvs. este indexată. În plus, multe pagini așteaptă săptămâni înainte ca Google să le preia.

Diferiți factori contribuie la această problemă și mulți dintre ei sunt aceiași factori menționați în ceea ce privește clasamentul- calitatea conținutului și linkurile sunt două exemple. Uneori, acești factori sunt, de asemenea, foarte diverși și tehnici. Site-urile moderne care se bazează pe noile tehnologii web au suferit în mod notoriu de probleme de indexare în trecut. Unele încă mai suferă.

Mulți specialiști SEO încă mai cred că lucrurile tehnice sunt cele care împiedică Google să indexeze conținutul. Acesta este doar un mit. Deși este adevărat că Google ar putea să nu indexeze paginile dvs. dacă nu trimiteți semnale tehnice consecvente cu privire la paginile pe care doriți să le indexați sau dacă aveți un buget de accesare cu crawlere insuficient, este la fel de important să fiți în consecvență cu calitatea conținutului dvs..

Majoritatea site-urilor web au o mulțime de conținut care ar trebui indexat- dar nu este. În timp ce lucruri precum JavaScript fac indexarea mai complicată  Site-ul dvs. poate suferi de probleme serioase de indexare, chiar dacă este scris în HTML.

Motive pentru care Google nu vă indexează paginile

Folosind un instrument personalizat de verificare a indexării, am verificat un eșantion mare dintre cele mai populare magazine de comerț electronic din SUA pentru probleme de indexare. Am descoperit că, în medie, 15% dintre paginile lor de produse indexabile nu pot fi găsite pe Google.

Acest rezultat a fost extrem de surprinzător. Ceea ce trebuia să descoperim în continuare era „de ce?”. Care sunt motivele pentru care Google decide să nu indexeze ceva care ar trebui indexat din punct de vedere tehnic?

Google Search Console raportează mai multe stări pentru paginile neindexate. De exemplu :„Accesat cu crawlere- momentan neindexat” sau „Descoperit- momentan neindexat”. Deși aceste informații nu ajută în mod explicit la rezolvarea problemei, este un moment potrivit pentru a începe diagnosticarea.

instrumentul google search console logo

Cele mai importante probleme de indexare

Pe baza unui eșantion mare de site-uri web pe care le-am colectat, cele mai populare probleme de indexare raportate de Google Search Console sunt:

1. „Accesat cu crawlere- momentan nu este indexat”

În acest caz, Google a vizitat o pagină, dar nu a indexat-o.

Pe baza experienței noastre, aceasta este de obicei o problemă de calitate a conținutului. Având în vedere boom-ul comerțului electronic care are loc în prezent, ne putem aștepta ca Google să devină mai pretențios când vine vorba de calitate. Dacă observați că paginile dvs. sunt „Accesate cu crawlere– momentan nu sunt indexate”, asigurați-vă că conținutul are o valoare unică:

  • Folosiți titluri unice, descrieri și copiați-le pe toate paginile indexabile.
  • Evitați copierea descrierilor produselor din surse externe.
  • Utilizați etichete canonice pentru a consolida conținutul duplicat.
  • Blocați Google să acceseze cu crawlere sau să indexeze secțiunile de calitate scăzută ale site-ului dvs., utilizând fișierul robots.txt sau eticheta noindex.

2. „Descoperit- momentan neindexat”

Această problemă poate cuprinde totul, de la probleme de crawling până la o calitate insuficientă a conținutului. Este o problemă masivă, în special în cazul magazinelor mari de comerț electronic. Acest lucru se aplică la zeci de milioane de adrese URL de pe un singur site web.

statistică problema de indexare descoperit- momentan neindexat

Google poate raporta că paginile de produse de comerț electronic sunt „Descoperite- momentan nu sunt indexate” din cauza:

  • O problemă cu bugetul de accesare cu crawlere: este posibil să existe prea multe adrese URL în coada de accesare cu crawlere și acestea pot fi accesate cu crawlere și indexate ulterior.
  • O problemă de calitate: Google poate crede că unele pagini de pe acel domeniu nu merită accesate cu crawlere și să decidă să nu le viziteze căutând un model în adresa lor URL.

Tratarea acestei probleme necesită o anumită expertiză. Dacă descoperiți că paginile dvs. sunt „Descoperite- momentan nu sunt indexate”, ar trebui să faceți următoarele:

  1. Identificați dacă există modele de pagini care se încadrează în această categorie. Poate că problema este legată de o anumită categorie de produse și întreaga categorie nu este conectată intern? Sau poate o mare parte din paginile de produse așteaptă în coadă pentru a fi indexate?
  2. Optimizați-vă bugetul de accesare cu crawlere. Concentrați-vă pe identificarea paginilor de calitate scăzută pe care Google petrece mult timp cu crawlere. Suspecții obișnuiți includ pagini de categorii filtrate și pagini de căutare interne. Aceste pagini pot ajunge cu ușurință la zeci de milioane pe un site obișnuit de comerț electronic. Dacă Googlebot le poate accesa cu crawlere, este posibil să nu aibă resursele necesare pentru a ajunge la lucrurile valoroase de pe site-ul dvs. web indexate în Google.

traseul parcurs de informație de pe site până la utilizator

3. „Conținut duplicat”

“Conținutul duplicat” poate fi cauzat de diverse motive, cum ar fi:

  • Variații de limbă (de exemplu, limba engleză în Marea Britanie, SUA sau Canada). Dacă aveți mai multe versiuni ale aceleiași pagini care sunt vizate către țări diferite, unele dintre aceste pagini pot ajunge neindexate.
  • Conținut duplicat folosit de concurenții dvs.. Acest lucru se întâmplă adesea în industria comerțului electronic atunci când mai multe site-uri web folosesc aceeași descriere a produsului furnizată de producător.

Pe lângă utilizarea rel=canonical (un atribut al tag-ului link care spune motoarelor de căutare care este URL-ul cel mai reprezentativ pentru indexarea unui site printre diversele disponibile), redirecționări 301 sau crearea de conținut unic, concentrați-vă pe oferirea unei valori unice pentru utilizatori. Un exemplu ar fi site-ul fast-growing-trees.com. În loc de descrieri plictisitoare și sfaturi despre plantare și udare, acest site vă permite să vedeți întrebări frecvente detaliate pentru multe produse.

De asemenea, puteți compara cu ușurință produse similare.

site comparare de produse similare

Pentru multe produse, oferă o întrebare frecventă. De asemenea, fiecare client poate pune o întrebare detaliată despre o plantă și poate obține răspunsul de la comunitate.

casetă pentru întrebări și răspunsuri de la comunitate

Cum să verificați acoperirea indexului site-ului dvs.

Puteți verifica cu ușurință câte pagini de pe site-ul dvs. nu sunt indexate deschizând raportul “Acoperirea indexului” în Google Search Console.

statistică acoperirea indexului în google search console

Primul lucru pe care ar trebui să vă uitați aici este numărul de pagini excluse. Apoi încercați să găsiți un model – ce tipuri de pagini de pe site nu sunt indexate?

Dacă dețineți un magazin de comerț electronic, cel mai probabil veți vedea pagini de produse neindexate. Deși acesta ar trebui să fie întotdeauna un semn de avertizare, nu vă puteți aștepta să aveți toate paginile de produse indexate, în special cu un site web mare. De exemplu, un mare magazin de comerț electronic este obligat să aibă pagini duplicat și produse expirate sau epuizate. Este posibil ca aceste pagini să nu aibă calitatea care le-ar pune în punctul de origine a cozii de indexare a Google (și asta dacă Google decide să acceseze cu crawlere aceste pagini în primul rând).

În plus, site-urile mari de comerț electronic tind să aibă probleme cu bugetul de accesare cu crawlere. Se cunosc cazuri ale magazinelor de comerț electronic care au mai mult de un milion de produse, în timp ce 90% dintre ele au fost clasificate ca „Descoperite- momentan neindexate”. Dar dacă vedeți că paginile importante sunt excluse din indexul Google, ar trebui să fiți profund îngrijorat.

Cum să creșteți probabilitatea ca Google să vă indexeze paginile

Fiecare site web este diferit și poate suferi de probleme de indexare diferite. Cu toate acestea, iată câteva dintre cele mai bune practici care ar trebui să vă ajute paginile să fie indexate:

1. Evitați semnalele „Soft 404”

mesaj de eroare 404

Asigurați-vă că paginile dvs. nu conțin nimic care ar putea indica în mod fals o stare 404 soft. Aceasta include orice, de la folosirea „Negăsit” sau „Nedisponibil” în copie la numărul „404” în adresa URL.

2. Utilizați linkuri interne 

schemă grafică linkuri interne site web

Linkurile interne sunt unul dintre semnalele cheie pentru Google că o anumită pagină este o parte importantă a site-ului web și merită să fie indexată. Nu lăsați pagini fără atenție în structura site-ului dvs. și nu uitați să includeți toate paginile indexabile în hărțile dvs. de site.

3. Implementați o strategie de crawling potrivită

păianjenul google

Nu lăsați Google să acceseze disfuncțional cu crawlere pe site-ul dvs.. Dacă se cheltuiesc prea multe resurse pentru accesarea cu crawlere a părților mai puțin valoroase ale domeniului dvs., poate dura prea mult până când Google ajunge la lucrurile bune. Analiza jurnalelor de server vă poate oferi o imagine completă a ceea ce Googlebot accesează cu crawlere și cum să o optimizați.

4. Eliminați conținutul duplicat și de calitate scăzută

Fiecare site mare ajunge în cele din urmă cu niște pagini care nu ar trebui să fie indexate. Asigurați-vă că aceste pagini nu își găsesc drumul în hărțile dvs. de site și utilizați eticheta noindex și fișierul robots.txt atunci când este cazul. Dacă permiteți Google să petreacă prea mult timp în cele mai nereușite părți ale site-ului dvs. acesta ar putea subestima calitatea generală a domeniului dvs..

eticheta robots.txt roșu cu albastru

5. Trimiteți semnale SEO consistente

Un exemplu comun de trimitere a semnalelor SEO inconsistente către Google este modificarea etichetelor canonice cu JavaScript. După cum a menționat Martin Splitt de la Google în timpul programului de lucru JavaScript SEO, nu puteți fi niciodată sigur ce va face Google dacă aveți o etichetă canonică în sursa HTML și una diferită după redarea JavaScript.

logo java script cu galben și negru

Web-ul devine prea mare

În ultimii câțiva ani, Google a făcut salturi uriașe în procesarea JavaScript, facilitând munca SEO. Actualmente, este mai puțin obișnuit să vedem site-uri web bazate pe JavaScript care nu sunt indexate din cauza specificului tehnologic pe care îl folosesc.

Internetul este în continuă creștere. În fiecare zi apar site-uri web noi, iar site-urile existente cresc. Poate Google să facă față acestei provocări?

Această întrebare apare din când în când. Reprezentanții Google afirmă următoarele:

„Google are un număr finit de resurse, așa că atunci când se confruntă cu cantitatea aproape infinită de conținut disponibil online, Googlebot este capabil să găsească și să acceseze cu crawlere doar un procent din acel conținut. Apoi, din conținutul pe care l-am accesat cu crawlere, putem indexa doar o parte.”

Pentru a spune altfel, Google este capabil să viziteze doar o parte din toate paginile de pe web și să indexeze o parte și mai mică. Și chiar dacă site-ul dvs. web este uimitor, ar trebui să țineți cont de asta.

Google probabil nu va vizita fiecare pagină a site-ului dvs., chiar dacă este relativ mică. Sarcina dvs. este să vă asigurați că Google poate descoperi și indexa paginile care sunt esențiale pentru afacerea dvs..

Ești pregătit să începem?

Fie că îți dorești un site de prezentare, un magazin online sau un redesign la vechiul tău site, noi te vom ajuta. Promovarea afacerii tale atât în mediul online, cât și în cel offline, îți va dezvolta afacerea și îți va garanta succesul acesteia. Îți vom fi alături pe tot parcursul acestui proces !