Запознаване с Plagiat Finder : интерфейс и настройки

Програмата Plagiat Finder е предназначена за проверка уникалността на текстове, т.е. липсата на съвпадения с други текстове в интернет. По-рано, за проверка на уникалност на текст, авторите ползваха ръчно търсене. Процесът изглежда приблизително така – взема се фрагмент от текста и се търси в по-голяма търсачка, за да се намери съвпадение с получените резултати. Колкото повече фрагменти се вземат и колкото са по-къси, толкова по-добра е проверката. Plagiat Finder изпълнява всичко това автоматично и не само – използва най-нови алгоритми за постигане на по-висока прецизност в процеса.

Добре, а защо е необходимо текстът да е уникален?

От качеството на текстовете зависи много, като се започне от позицията в търсачките, респективно посещаемостта на сайта ви(погледнете Panda алгоритъма на Google) и завърши с това, ще остане ли посетителя на сайта, ще го добави ли в отметките си, ще разгледа ли други страници. Авторските текстове не са леко занимание. Съдържанието им трябва да бъде интересно, лесно читаемо, уникално и отговарящо на очакванията на потребителя. Сериозните сайтове пишат текстовете си сами или се обръщат към копирайтъри - хора, занимаващи се професионално с писане на съдържание.

Има една друга група сайтове, агрегатори на съдържание, които събират вече публикувани текстове и ги предоставят на посетителите си. Повечето от тях дори не поставят връзка към авторското съдържание. За етичността на процеса няма да говорим. Това е едно от многото приложения на Plagiat Finder – да намерите кой ползва вашите текстове. Контактът с агрегатора може ако не друго, то поне да ви донесе обратна връзка към вашия сайт. Знаете колко е важно това. Да приключим с общите думи и да погледнем програмата.

Plagiat Finder – интерфейс, функции и настройки

Хората, които работихме по програмата, сме убедени привърженици на идеята „Малкото е повече“ („Less is more“). Тук няма да намерите броене на думи и символи, няма да ви подчертаваме синтактични и граматични грешки. За всичко това има достатъчно добри софтуери. Целта ни беше Plagiat Finder да върши едно нещо, но да го върши максимално добре – да намери по възможност всички пълни и непълни дубликати на въведения текст. Преди да преминем към разглеждане на интерфейса, може да видите краткото видео на работния процес:

Основен прозорец на програмата:

Plagiq Finder - основен прозорец

На снимката се виждат основните елементи – стартиране на търсенето, настройки, който да са ви под ръка. В контекстното меню също са достъпни най-необходимите функции.

Прозорец за настройки:

Прозорец за настройки

Това е един от най-важните елементи на Plagiat Finder. Тук ще можете да настроите програмата да отговаря на вашите нужди. Повечето от тях са ясни по наименованието си. Да погледнем специфичните, свързани с алгоритмите за търсене.

"Брой шингли за сравнение" – колкото по-малък е броя, толкова по-прецизно ще е търсенето на дубликати, но и ще се ползват повече системни ресурси. Препоръчваме, ако имате достатъчно добър компютър, да оставите стойността по подразбиране - 3. Добри резултати ще получите и при по-големи стойности, разбира се. Понятието на повечето от вас е непознато, но на този етап това ви е достатъчно като информация. По-късно ще опишем ползваните алгоритми в отделни статии.

"Ползване на изходният текст/Ползване на шингли" в заявките за търсене. Програмата взема случайни „проби“ от вашия текст, които се търсят за съвпадение в двете най-големи търсачки – Google и Bing. Ако изберете опцията ползване на изходния текст, в заявката за търсене се пуска текста както сте го въвели. Ако изберете опцията шингли – текстът се изчиства от всички „стоп“ думи( често срещани думи, които нямат стойност) и чак след това се генерират заявките. Ние предпочитаме опцията с шингли, защото и търсачките пренебрегват „стоп“ думите, а така се позволява да се изследват по-голям брой „проби“ от текста.

„Брой шингли“ в заявките за търсене – тук, за разлика от шинглите за сравнение, можем и е препоръчително да сложим по-висока стойност, за да се пуснат повече проби от текста в търсачките. По подразбиране стойността е 5.

Прозорецът след приключване на работата:

Резултати

Появява се бутон за запис на получените резултати е отчет. Избрахме да записваме отчета в стандартен html файл, поради широката достъпност на формата.

Намерените дубликати се добавят под основния текст. Връзките се отварят в браузъра ви по подразбиране. Бутонът „Виж“ със син цвят на текста прави същото.

Бутонът „Виж“ с бял свят на текста отваря резултата в наш интегриран браузър. Това са резултати, на които сме успели да отстраним ненужните елементи и да оставим само тялото на публикацията.

Plagiat Finder може да свалите тук:

За предложения, впечатления от работата на програмата, намерени грешки, моля изпозвайте формата по-долу. Обратната връзка е изключително важна за нас и ще доведе до подобряване в следващите версии.

7-7-2015

Предложения, съобщения за грешки, коментари