Obiectivul fundamentat al acestui pachet de lucru este dezvoltarea unui program de detectare a similitudinii textuale (și plagiatului) capabil de analiza sintactico-semantica si care, in versiunea bilingva, sa poata compara un anumit text cu texte de pe Internet sau cu documente stocate in repozitorii proprii.
Doua sunt aspectele inovatoare propuse: detectarea parafrazei cu un grad scazut de originalitate in compararea documentelor in limbile engleza si romana, stiut fiind ca pentru cazuri de simpla copiere, programul va rula algoritmii „clasici”, asa cum apar in literatura de specialitate.
Un al doilea aspect, si cel mai important, tine de compararea unui text scris in limba romana cu texte din acelasi domeniu publicare in limba engleza. Este un pas foarte important, intrucat experimentele de pana acum nu sunt foarte convingatoare.
De asemenea, pentru ca acest program sa poata rula in bune conditii, este necesara construirea unui repozitoriu cu documente stiintifice, de o anumita anvergura, pentru ca analizele comparative sa fie concludente.
Prin atingerea acestor deziderate, Romania se poate, in sfarsit, inscrie in randul tarilor capabile sa cerceteze originalitatea productiei sale stiintifice.