Similaritate textuala

In atingerea obiectivului activitatii noastre, de a crea un program aplicabil evaluarii contributiilor stiintifice, conceptul de la care pornim este cel de similaritate. Daca comparam doua texte din acelasi domeniu, este firesc sa existe intre ele un anume grad de similaritate. Acesta poate tinde spre zero, si in acest caz vorbim de originalitate, sau spre 1, caz in care putem vorbi, de plagiat.

In afara aplicatiilor destinate detectarii plagiatului, programul are si un obiectiv scientometric. Prin analiza similaritatii unui lot de articole in raport cu un articol de baza, deschizator de drumuri, putem deduce felul in care evolueaza o teorie, ce contributii apar pe parcurs, ce concepte noi sunt propuse, ce se constituie in corpus de baza si ce idei comune sunt exprimate frecvent.

Analiza similaritatii serveste astfel mai multor cercetari aplicate, inclusiv degajarii unor harti ale cunoasterii din investigarea aprofundata a unui domeniu particular al stiintei.