Spesso succede che ci si chieda quanto un testo sia originale. Il più delle volte ciò avviene per i testi online in quanto, si sa, il copia/incolla è molto facile.
Non solo i ragazzini, alle prese con ricerche e tesine, sono tentati di usufruire ampiamente di wikipedia & co., ma spesso succede anche con blog di un certo livello, a discapito dell’originalità del testo.
Non è un caso che in questi giorni di polemiche sul coronavirus siano comparsi testi perfettamente identici su varie testate giornalistiche. A volte si tratta di una contingenza, quando cioè i testi sono stralci di interviste o comunicati, tuttavia il risultato è quello di trovare molti siti che dicono la stessa cosa. O, meglio, le stesse identiche parole.
Il punto è: se i lettori sono ormai tristemente avvezzi a questo sistema, tanto da non porsi nemmeno il problema, come reagisce invece google a queste duplicazioni di contenuti?
Quando un testo è originale
Partendo dal presupposto che, in un mondo come quello del web dove tutto è già stato scritto, spesso chi scrive non ha la possibilità di dire cose del tutto nuove, la differenza la fa la rielaborazione personale.
Prendere informazioni da altri siti o blog è una pratica consueta più o meno per tutti. Sebbene non tutti lo facciano, è da dare per scontato che si valutino bene le fonti, che siano più di una e che si sappia dove trarre la propria documentazione, magari incrociando le informazioni anche con qualche testo cartaceo. Tuttavia, il materiale reperito andrebbe poi sempre rivisto e riscritto completamente.
Forse non tutti sanno che non è sufficiente sostituire qualche parola qua e là né girare le frasi. E non solo per non ricadere nel vero e proprio plagio, quanto per evitare le google ci penalizzi.
Google infatti si accorge se in un testo ci sono molte combinazioni di parole simili a un altro testo, soprattutto se inserite in un contesto simile con titoli e sottotitoli analoghi.
Oggi gli algoritmi che i motori di ricerca utilizzano per valutare la qualità di un sito sono sempre più orientati alla qualità dei contenuti. Parrebbe che criteri tecnici come l’essere responsive siano passati in secondo piano, dopo una selezione pressoché naturale di quelli non ben visibili su device mobili.
Pertanto i progressi nel campo del riconoscimento testuale, ormai proiettati verso una vera e propria intelligenza artificiale, sono sempre più vicini ad un tipo di comprensione del testo analogo a quello umano.
Come scoprire se un testo non è originale
Spesso, quando scriviamo su un blog, ci preoccupiamo che nessuno rubi i nostri testi integralmente. A me personalmente non è mai successo ma, da quando bazzico nel mondo dei litblog, almeno un paio di volte è capitato a blog di amici. Non tante volte, per la verità, ma comunque troppe.
Quello che però tendiamo a non chiederci è se siamo noi a “rubare” il testo di altri. Intendiamoci, non sto certo dicendo che lo si faccia apposta né interamente, ma molto più sovente di quanto crediamo un testo può avere una percentuale di unicità piuttosto bassa.
Questo può capitare proprio perché l’originalità di un testo non dipende solo dal fatto che il testo venga riscritto, ma che, come si diceva sopra, non ci siano troppe combinazioni di parole simili in un contesto analogo.
Che cos’è la percentuale di unicità di un testo
La percentuale di unicità non è un valore assoluto ma è il risultato del confronto con tutti i testi presenti nel web. Alcuni tool permettono di confrontare il proprio testo e di conoscere quanta parte del testo che si vuole pubblicare sarebbe unica. In genere si dice che un testo è originale se ha una percentuale di unicità almeno del 90%. Io, però, per i testi che scrivo per lavoro cerco sempre di ottenere un’unicità del 100%.
Scrivendo, e tanto, per lavoro, ammetto di essermi trovata in situazioni in cui il mio testo aveva una unicità più bassa, tanto da dover fare revisioni su revisioni per raggiungere la soglia desiderata: la cosa sorprendente è che talvolta trovavo corrispondenza con siti che non avevo neanche mai aperto.
Questo può capitare soprattutto quando un testo richiede una terminologia tecnica non facilmente sostituibile. Se, per esempio, si fa riferimento a norme di legge oppure a patologie mediche o, ancora, ad argomenti scientifici, i termini da utilizzare sono specifici e sostituirli vuol dire perdere in precisione se non, addirittura, scrivere informazioni scorrette.
La soluzione può essere, quando è possibile, cambiare l’impostazione dell’articolo: se già ci sono online un certo numero di articoli con un taglio analogo, forse si può cercare un modo diverso di impostare la questione, magari modificando i sottotitoli o, meglio ancora, il focus.
I tool per controllare il tasso di unicità di un testo
Ovviamente per sapere quanto è originale il nostro testo, partendo dal presupposto di non aver copiato spudoratamente, è necessario utilizzare dei tool.
Non starò qui a elencarli tutti perché li potete facilmente trovare su altri articoli analoghi al mio. Tuttavia, nella maggior parte dei casi si tratta di strumenti a pagamento, alcuni con la versione free che però limita il numero di controlli giornalieri o le funzioni.
Un tool poco conosciuto qui da noi è text.ru, sito che ho scoperto per lavoro. Si tratta di un sito russo (ecco perché non lo conosce nessuno), ma ha la versione inglese. Se ci si registra gratuitamente, permette un numero di controlli credo infiniti (non lo so per certo, ma io ne faccio davvero decine ogni giorno e non mi ha mai bloccata) e funziona veramente bene.
In conclusione, proteggetevi dai plagi, ma fate attenzione a non farne pure voi, sebbene del tutto inconsapevolmente. Intendiamoci, nessuno vi potrà mai accusare di plagio se avete un tasso di unicità, chessò, del 70%. Se, però, in uno stesso blog si sommano tanti articoli con un tasso non elevatissimo, google potrebbe non essere del tutto felice e penalizzarvi.
L’utilizzo di uno dei tool che trovate online vi mette al riparo da qualsiasi critica e vi aiuta a posizionarvi meglio.
8 Comments
Molto interessante! Non conoscevo questo strumento, che ora salvo tra i miei strumenti grazie a te. Di trovare contenuti identici su siti diversi capita davvero spesso.
Mi fa piacere se questo strumento ti sarà utile. Io ormai lo uso d’abitudine prima di pubblicare qualsiasi articolo.
Ciao Silvia, non conoscevo questi tool ma il problema si. Me ne accorgo quando cerco di informazioni sul web, spesso ci sono articoli ampiamente identici eppure appaiono nella prima pagina della ricerca x chiavi di Google. Come mai?
Be’ i motivi possono essere molti e non è semplice individuare quale, o quali, incidono in un caso o nell’altro. Se si tratta di un singolo post con contenuto in parte simile è probabile che google non penalizzi l’intero sito, tanto più se è comunque un sito con una certa autorevolezza. Un’altra ipotesi potrebbe essere che google se ne accorga subito, quindi la penalizzazione potrebbe arrivare a lunga scadenza. Inoltre, non è l’unico criterio di valutazione e se altri sono preponderanti potrebbe incidere in misura minore. Infine, si sa che i misteri di google sono infiniti, quindi si parla di buone pratiche ma nessuno può avere la certezza che valgano indistintamente. Io, per esempio, sono convinta, per quanto ufficialmente venga negato, che una qualche influenza sull’organico arrivi anche dalle sponsorizzazioni. Pertanto, per me, è possibile che chi investe molto abbia comunque una qualche precedenza rispetto a chi non lo fa. Tuttavia, lavorando sul proprio sito credo che sia importante tenere conto anche di questo aspetto, tanto più che è una forma di rispetto verso i propri lettori e verso i blog concorrenti.
Sulle risorse informatiche è più che facile trovare articoli simili, soprattutto sulle soluzioni per determinate questioni. La differenza, almeno per me, è la chiarezza espositiva. Si vede quando l’autore copia e non è in grado di spiegare bene la materia o la soluzione (soprattutto se è codice) non funziona proprio.
Mi sono accorta ora della citazione! Eh già, nel mio caso la copia era palese perché si erano trascinati dietro dalla pagina del mio blog addirittura i css proprietari del mio template. E avevano pure riciclato le battute iniziali e finali…
Adesso non riesco nemmeno più a verificare l’unicità di quell’articolo, mi arrivano notifiche di copia quando in realtà sono citazioni con tanto di link al blog. Dovrei anche modificarlo, perché nel frattempo gli stessi utenti con i loro commenti hanno tirato fuori altri termini che potrebbero arricchirlo. 🙂
Mi segno comunque il sito russo. Magari ci faccio un saltino. 😉
Sicuramente in settori molto tecnici, come quelli informatici, il rischio di dire cose già dette, magari proprio con le stesse parole, è molto elevato. Per questo, a mio parere, vale sempre la pena di fare ricerche su quello che già c’è, sforzandosi di proporre gli argomenti, quanto meno, da un altro punto di vista o approfondendo aspetti specifici. Certo che per poterlo fare occorre anche molta competenza e, come tu sai meglio di me, purtroppo il web pullula di gente improvvisata.
Per quanto riguarda il plagio che tu hai subìto, con lo strumento che ho citato puoi vedere tutti i siti che hanno una percentuale di testo identico al tuo. È chiaro che percentuali di testo molto basse (1-2%) possono essere casuali, anche perché in un argomento specifico come quello in oggetto si usano termini tecnici che non possono essere sostituiti. Ma quando si sale già oltre il 10%, il sospetto è lecito. È chiaro che poi solo una lettura del post può permettere di capire se sia davvero un plagio o se sia una coincidenza.
Non conoscevo questi strumenti, prendo nota!
Per i miei post di solito scrivo a ruota libera alcune mie considerazioni, dubito che qualcuno voglia copiarmi; invece alcune volte su determinati argomenti prendo spunto da letture o articoli letti qua e là, in quel caso però cito sempre la fonte.
Citare la fonte è senza dubbio un’ottima cosa, che non solo mette al riparo da possibili accuse, ma che denota la serietà di chi scrive. Anche perché ricevere una citazione fa sempre piacere in quanto testimonia un apprezzamento da parte di chi l’ha fatta.