Consulente Web Marketing e Consulenza Motori di Ricerca

Web Marketing & Search Engine Consultant

Come testare il tuo sito per contenuti duplicati ed uscire dai risultati supplementari

Alcuni suggerimenti utili per capire se il tuo sito soffre di

Il tuo sito lo hai trovato tra i risultati supplementari di Google ? Vuoi sapere come uscirne alla svelta ? Ho qualche suggerimento utile in tema contenuti duplicati che potrebbe aiutare e che ha fatto uscire dal ghetto dei supplemental results siti di Clienti.

Sebbene indicazioni autorevoli dicano di stare calmi e che non ci sono grossi problemi, di fatto se la maggior parte delle tue pagine sono lì dentro il sito è praticamente invisibile, poiché sono risultati ritenuti "meno importanti" rispetto agli altri e quindi hanno una bassissima priorità – di fatto non vengono proposti nelle SERPs.

Quindi il sito è invisibile. Nell’esaminare alcuni siti dinamici in questi giorni mi sono imbattuto nel problema, trovando alcune novità (era un po che non facevo dei check di questo tipo): Intanto ho notato che facendo una ricerca su un sito con il comando site: e sfogliando le pagine dei risultati in successione, può succedere che non si ha alcuna segnalazione. Se si salta dalla prima alla decima pagina allora può apparire la fatidica scritta:

Avviso che il sito è tra i risultati complementari di Google

AHI !! Ho notato che la scritta risultati supplementari è sparita. Un errore oppure omissione intenzionale ? Forse per smorzare gli allarmismi nell’utenza. Comunque penso che andrebbe dichiarato apertamente che un risultato è supplementare oppure no, in modo da dare la possibilità a tutti di capire lo stato del proprio sito – anche chi non è un esperto per porvi rimedio. L’inclusione nei risultati supplementari può essere causato da alcuni fattori (o la loro combinazione):

  • Contenuti duplicati (di cui andiamo a parlare qui di seguito)
  • Pagine che presentano TITOLI e META TAGS sempre uguali per tutte le pagine del sito E’ un problema che si presenta per siti dinamici con accesso a dati tramite un template che prevede l’inclusione statica dell’intestazione della pagina
  • Una presenza ridotta di contenuti indicizzabili – molte pagine con pochi contenuti e magari poco interessanti
  • Troppi parametri nella URL (e magari anche una bella session ID per rendere le cose ancora più complicate)
  • Le pagine presentano una scarsa integrazione nel sito con pochi link entranti o una organizzazione gerarchica che le penalizza (troppo lontane dalla home page e quindi ritenute di scarso valore)
  • Pagine orfane di link ma che in passato ne avevano

Pur essendo presenti contenuti di qualità, a volte la presenza di menu di navigazione eccessivamente lunghi, che si presentano uguali a se stessi nel sito, unito alla assenza di link entranti, può essere un fattore determinante che scatena la condanna supplemental. Prendi una pagina web che è nell’indicesupplemental e suddividila (salvando in diversi file) nelle varie parti in cui la pagina stessa può essere suddivisa:Screenshot di una analisi per capire se ci sono contenuti duplicati

Dalla screenshot puoi vedere come l’intera pagina (che ho esaminata) ha dimensioni 49 KB, con le dimensioni delle varie sezioni della stessa. Il content è 19 KB, una percentuale minoritaria rispetto alla pagina nella sua interezza.

In termini percentuali all’incirca il 40%. Nel sito dal quale ho preso questo esempio decine di migliaia di pagine sono supplemental e visto che gli altri fattori dell’elenco precedente non sono applicabili, questo sembra essere il motivo principale di segregazione. In casi come questi è bene alleggerire i menu all’essenziale e focalizzarne il contenuti per dare una caratterizzazione più in tema sull’argomento trattato.

Evita linking a sezioni o altri siti che poco hanno a che fare con l’argomento trattato nella pagina. In alcune delle pagine esaminate anche l’uso di titoli e meta non era ottimale, con una anemia da keywords e titoli molto generici che non fa bene alla visibilità anche quando non si è nei risultati supplementari.

In casi come questi la mia linea di pensiero è aumentare il peso del contenuto al 60% della pagina nel suo complesso, per attirare l’attenzione dei motori di ricerca (in particolare Google) che sicuramente daranno una maggiore considerazione al contenuto che in questo modo riesce a farsi sentire rispetto al rumore di fondo … Anche l’uso di una sitemap che va registrata con Google può mettere in evidenza problemi del sito – non posso dire se vengono segnalati anche problemi relativi ai risultati supplementari. Hai avuto problemi con il tuo sito (o siti che tratti) ?

Come hai risolto il problema risultati supplementari ? E’ un problema molto interessante sul quale è bene far circolare informazioni ed esperienze – fammi sapere.

11 Replies

  1. Dal 7 Marzo il mio sito ha perso moltissime posizioni scomparendo quasi del tutto da GOOGLE per alcune chiavi che prima si può dire per anni mi garantivano la presenza in prima pagina. Questo problema mi era accaduto anche nel giugno 2006 ma in quell’occasione la google dance interessò moltissimi siti. Dopo un mese sono tornato senza fare nulla ad occupare le prime posizioni. Dal 7 marzo 2007 ci risiamo e a differenza dell’altra volta cercando su vari blog ho notato che il problema non ha investito siti. Non so a cosa attribuire questo problema se dipende dall’hosting magari il server poteva essere downtime. Facendo una ricerca per site:www.montecelio.net ho notato in 14^ pagina la mia index.asp è nei risultati supplementari mentre in prima pagina trovo http://www.montecelio.net. Ma non dovrebbe essere la stessa pagina? Perchè trovo http://www.montecelio.net in prima e http://www.montecelio.net/index.asp nei supplementari? Potrebbe essere questo uno dei problemi? Grazie per un ‘eventuale risposta.

  2. Ciao Nello,
    caso molto interessante il tuo – l’ho studiato un attimo oggi per te e per gli altri miei lettori – ecco cosa ho trovato.

    Intanto una stranezza a livello sistema del tuo dominio in quanto

    http://montecelio.net punta all’IP 62.149.128.151

    mentre

    http://www.montecelio.net punta all’IP 62.149.130.21

    devi sapere che queste pagine sono tutte diverse per i motori di ricerca e dovresti gestire questo evento lato server con dei redirect permanenti (301) – non so se questo lo hai fatto.

    Non saprei dire se la perdita di visibilità per alcune keywords sia attribuibile interamente al discorso risultati supplementari ma potrebbe rafforzare l’ipotesi di una azione di razionalizzazione dei risultati. Pensa se tu fossi la Sig.ra Google con miliardi di pagine da gestire. Dovendo scegliere le pagine migliori da proporre agli utenti certamente elimineresti quelle secondo te sono in qualche modo considerate duplicate – forse è successo questo al tuo sito.

    Faccio una ulteriore osservazione.

    Ho notato che oggi pomeriggio dando il comando site Big G mi ha restituito un numero di pagine MOLTO diverso in due occasioni a distanza di pochi minuti – una prima interrogazione ha restituito 78 pagine, e ad un secondo tentativo il numero è salito a 678. Infatti a pelle mi sembrava un sito con molte più pagine di 78 ed è così (stando ai dati forniti successivamente dalla Sig.ra)

    C’è poi da considerare che ci sono dichiarazioni in merito ai risultati supplementari di Google di cui ho parlato anche in altri post perché questo problema serpeggia anche se se ne sta parlando poco (fino a questo momento). Si sa che ci sono dei problemi nel senso che pur essendo presentati come risultati supplementari, non sempre lo sono. Google ha detto che questo problema verrà risolto.

    Sicuramente ci sono dei problemi di reporting di Google, ma un caso come il tuo potrebbe essere da studiare in quanto vedo che hai un template molto “pesante” nel senso che si ripete uguale a se stesso in tutte le pagine, ed a volte il contenuto vero è poco rispetto al peso relativo del template (=i menu di navigazione).

    Forse riducendo il peso dei menu nelle pagine questo problema rientra. Forse se Google sistema il problema dei risultati supplementari sparisce.

    Se fossi in te farei una valutazione puntuale dei contenuti delle pagine per ridurre il peso dei menu privilegiando i contenuti.

    Ho visto che hai all’incirca 179 link esterni che conferiscono una reputazione di rilievo solo per poche keywords – infatti se cerco:

    guidonia comune

    il tuo sito esce in prima pagina con ben due posizioni (sono le keywords con cui hai abbastanza reputazione). In linea di principio non mi aspetterei di vederti primeggiare in testa a Google od altri motori di ricerca per keywords molto competitive – sarebbe da approfondire lo studio del sito.

    Intanto spero questa possa aiutarti 🙂

    Sante

  3. Salve Sante, prima di tutto vorrei ringraziarti per avermi risposto e per aver esaminato il mio problema.

    Ti ho scritto perché non riesco a darmi una spiegazione su quello che mi è successo, la quasi completa sparizione da GOOGLE per un sito che viene aggiornato quotidianamente con molto impegno senza usare trucchi ed altro per stare in prima pagina. Io che alcune pagine puntassero ad un IP diverso non lo sapevo e non so se questo sia riconducibile al mio provider che sto pensando seriamente di cambiare.
    Dimmi se questo dubbio potrebbe corrispondere alla realtà.
    Io quindi redirect permanenti (301) non ne ho mai fatti e sinceramente non saprei dove andarli a fare.

    Che il sito potrebbe essere ottimizzato alleggerendo le pagine sono d’accordo con te. Volevo dirti che il risultato che vedi facendo la ricerca su google per “guidonia comune” non appartiene a me ma ad un altro sito che si chiama montecelio.it. Prima io venivo fuori in prima pagina ed in prima posizione con ricerche del tipo:
    negozi a guidonia, ristoranti a guidonia, alberghi guidonia,vendita mobili tivoli, offerte materassi roma e tantissime altre (per le chiavi locali ero il più competitivo). In motori come Yahoo, Msn, ecc. sono sempre in prima pagina ormai da anni anche perché la concorrenza non è molta ed i siti concorrenti non brillano certo di ottimizzazione. Ad esempio anche con ricerche particolari come “Sfilata delle Vunnelle a Montecelio” risultato che restituisce poche pagine io mi trovo in terza pagina addirittura dietro a pagine di risultati supplementari. L’unica chiave di ricerca che mi fa ancora apparire in prima pagina ed in prima posizione è “villanova di guidonia” e “numero abitanti guidonia”. Spero solo che questo sia un problema momentaneo riconducibile magari anche ad un downtime che non ha permesso un corretta indicizzazione.

    Ti ringrazio per la tua disponibilità e per l’eventuale risposta che vorrai dare ai miei dubbi e chiarimenti.

    Di nuovo grazie.
    Nello

  4. Effettivamente mi sono sbagliato nel vedere il sito !

    Per il resto direi che una ottimizzazione lato server sia importante nel tuo caso ed una rivisitazione anche della struttura delle pagine ti possa aiutare – lo sto notando anche su altri siti che ho visto nelle settimane scorse.

    In bocca al lupo !!

    S.

  5. shiseido

    Ciao e grazie per aver cominciato il tema, mi é servuto molto.
    Saluti.

  6. Ciao a tutti,
    la sitemap del mio portale contiene circa 500 pagine ma ne risultano 55 inviata a google (lo vedo da strumenti per webmaster).
    Leggendo questo articolo mi è sorto un dubbio:
    – io carico in automatico gli annunci su altri 9 portali immobiliari dove compare esattamente il mio articolo

    può essere visto come contenuto duplicato? esistono degli strumenti per capire quali sono le pagine che google considera duplicate e la fonte in cui viene rilevata prioritaria??
    grazie a tutti

  7. ciao e grazie per i tuoi preziosi consigli
    ti ho trovato solamente oggi e voglio farti analizzare se ti è possibile il mio sito appunto http://www.toner-compatibili.com
    è stato creato circa un anno fa ma solamente due mesi fa ho caricato un ecommerce di zencart.
    questa è la domanda
    sono registrato su google con gli strumenti per i webmaster ed ho inviato circa 1470 pagine di prodotti e categorie.
    ne vedo indicizzate solamente 179 e vedo che continuamente lo spider di google è presente praticamente sempre nel sito a scansionare pagine.
    dal pannello di controllo di zencart vedo questo dato nello strumento chi è in linea, non vorrei fare delle cavolate cercando delle procedure che potrebbero portare il sito ad un peggioramento, ti chiedo se puoi rispondermi consigli sul da farsi per fargli caricare in maniera ottimale tutte le pagine.
    vedo inoltre che ci sono molte di queste duplicate, come posso fare per toglierle o se vanno tolte?
    ciao e grazie per i tuoi consiglil.
    Michele

    1. Ciao Michele – scusami per il ritardo con cui ti rispondo – è da un po di tempo che sono latitante qui sul blog per molte ragioni – mi faccio un appunto della tua richiesta e mi vedo il sito – se tu mi dai il permesso di pubblicare qualce considerazione nel blog sarebbe perfetto 🙂

  8. Innanzi tutto complimenti per l’ottimo sito e le informazioni utilissime in fatto di ottimizzazione per i motori di ricerca.
    Vorrei porre, se lecito, alla tua attenzione un mio forum che ha seri problemi nel venire indicizzato.
    Si chiama Forum di musica ed è sviluppato con phpbb3.
    Nonostante sia intervenuto per scolpire il passaggio dello spider e del page rank per spingere soprattutto le risorse nuove e non quelle inutili, la situazione è che i nuoi post vengo indicizzati in oltre un mese.
    Da cosa può dipendere ?
    Puoi aiutarmi, per favore?
    Grazie.