Home » Blog » Seo » Filtraggio di contenuto duplicato e Meta Tag di Attribuzione della Fonte: prevarrà l’originale (finalmente)?

Filtraggio di contenuto duplicato e Meta Tag di Attribuzione della Fonte: prevarrà l’originale (finalmente)?

Sulla duplicazione di contenuti e il suo impatto nel ranking si dibatte da tempo, non tanto riguardo alle possibilità di penalizzazioni (che comunque per grosse quantità di dati duplicati, abbinati a scarso trust del sito, può esserci), quanto più per il filtro anti-duplicazione che riduce a un set limitato il numero di risultati restituiti all’utente per query che presentino una mole di risultati simili o identici (si pensi per esempio ai comunicati stampa).
Le domande sono sempre le solite… Come si fa a non incappare nel filtro? Come posso evitare che il mio articolo venga escluso, pur essendo l’originale ripreso poi da altri? (O guardandola da un punto di vista più blackhat: come fare per essere nelle SERP con contenuti rubati e assemblati in vari modi?) Ricordo a riguardo un interessante video di SeoMoz in cui Rand Fishkin faceva un po’ il punto della situazione e illustrava i principali fattori che Google utilizzava per premiare una pagina piuttosto che un’altra, in caso di contenuti pressoché uguali.
All’argomento, s’è interessata anche l’Università de L’Aquila, una delle più aggiornate per quanto riguarda SEO e argomenti affini, e i risultati dei test sono stati condivisi sul forum di Giorgio Taverniti alcuni mesi fa.
Lungi dall’essere tutto chiaro, segnalo oggi un brevetto dibattuto dal sempre puntuale Bill Slawski, che su Seo by the Sea illustra un brevetto dal titolo Clustering by previous representative che descrive come Google potrebbe gestire i duplicati. Nel brevetto, si leggono i seguenti criteri per l’identificazione:

Assegnazione del documento identificato a uno o più cluster;
Selezionare un documento rappresentativo per ciascuno degli uno o più cluster;
Determinare quando il documento rappresentativo è stato re-spiderizzato;
Determinare un documento rappresentativo precedente con cui quello attuale era associato in una precedente operazione di clustering;
Se è determinato che il documento rappresentativo corrente non è stato visitato di nuovo dagli spider, determinare uno dei cluster al quale il il precedente documento rappresentativo è stato assegnato nella corrente operazione di clustering;
Combinare uno dei cluster associati al documento rappresentantivo corrente che non è stato re-spiderizzato con uno dei cluster associati con il precedente documento rappresentativo per formare un cluster combinato;
Conservare l’informazione riguardante il cluster combinato.

Dal brevetto, quindi, emerge come Google combini i risultati simili in cluster e per ciascuno di questi aggregati scelga un documento “principe”. I criteri usati per sceglierlo prevedono:
- Informazioni sui link (in entrata e in uscita verso altre pagine o all’interno della stessa pagina)
- La data di creazione del documento
- Una metrica di ranking (Pagerank in alcuni casi) della pagina (o del documento)
- Informazioni sull’anchor text
- Come appare l’URL (un URL breve e con parole potrebbe essere migliore di uno lungo e senza parole)
- Informazioni sulla popolarità
- Qualità del sito
- Età del sito
- Altri tipi d’informazione

Chiaramente non è detto che le cose stiano davvero così e che il brevetto sia stato messo in pratica, ma potrebbe essere.

Intanto, c’è un’altra novità e riguarda i Metatag di Attribuzione della fonte introdotti per Google News (ma può anche essere che se le cose vadano come sperato sul motore verticale poi il tutto sia esportato al Web Search…): si tratta di due meta tag che è possibile inserire per segnalare se l’articolo è la fonte originale o è stato ripreso.Per chi pensasse di usare il secondo per forzare il ranking, da Mountain View fanno sapere:

Se troviamo siti che abusano di questi tag, possiamo, a nostra discrezione, ignorare i tag o rimuovere del tutto il sito da Google News

Chissà se l’ammonimento terrà a freno i cattivi propositi, e chissà se qualcuno deciderà di utilizzare il primo tag e “accusarsi” d’aver copiato. Voi che ne pensate?

(Immagine tratta da Search Engine Land)


Laureato in Ingegneria elettronica, ho scoperto che mi piace di più fare il SEO Specialist e dopo un paio d'anni da amatore e qualche corso e qualche convegno, nel 2010 ho iniziato a farlo per lavoro. Attualmente sono in una nota agenzia di Roma. Oltre a scrivere di motori di ricerca su questo blog, pubblico sporadicamente guest post su siti internazionali. Potete trovarmi qua e là come zen2seo.

Commenta