Версия 1.0.7

Обратната връзка с реални потребители даде резултати. Изчистиха се множество недоработки и грешки.

Забавяне при по-слаби компютри

За да осигурим бърза работа на Plagiat Finder, ние активно ползваме свободните системни ресурси. Проблемът дойде от това, че нашите тестови компютри са мултиядрени и забавянето не си проличаваше. Добавихме определяне броя на ядрата и за едноядрените процесори пускаме по-щадящ алгоритъм.

Системна грешка при къс текст

Вградените алгоритми се нуждаят от определен брой думи за образуване на шинглите. Не бяхме предвидили проверка за къс текст. Реализирана.

Комуникативен интерфейс

Не бяхме предвидили известяване на потребителя какво точно се случва. При ненамерени дубликати не се извеждаше съобщение. Реализирана по-добра комуникация с потребителя.

Подчетаване на частични дубликати

Във вградения html рендер въведохме пробно подчетаване на повтарящи се елементи.

Разултатът - по-лек, по-удобен, по-комуникативен Plagiat Finder

Версия 1.0.1

Първа публична версия

След продължителни вътрешни тестове решихме да подложим Plagiat Finder на истинското изпитание - работата с реални потребители. Не бъдете много строги към нас за грешките. Използвайте поддържащият блог за всички предложения и препоръки, който ви хрумнат, както и за докладване на установени грешки.

Шингли и определяне на близки дубликати

Внедрена е пълна реализация на метода с шингли за намиране на непълни дубликати. Тестово е пуснато и търсене на дубликати с шингли в търсещите машини.

Нормализация на текста

Частично реализирано нормализиране на текста със стемъри. Предстои внедряване на по-пълен речник за стеминг на български език благодарение на публичните разработки на Българска академия на науките.

Търсещи машини

Търсене в най-голямата библиотека за информация - интернет, благодарение на Google и Bing. Предстои вграждане на Yandex.

Предложения, съобщения за грешки, коментари