В России создали метод распознавания плагиата в текстах на четырех языках

Учёные НГТУ разработали математический метод определения авторского стиля на русском, английском, китайском и амхарском языках для борьбы с плагиатом.

В России создали метод распознавания плагиата в текстах на четырех языках
Источник фото: ru.freepik.com

Учёные Новосибирского государственного технического университета (НГТУ) представили уникальную разработку, способную изменить подход к анализу текстов. Они создали математический метод, который с высокой точностью определяет авторский стиль на четырёх неродственных языках: русском, английском, китайском и амхарском (официальный язык Эфиопии). Это открывает широкие возможности для борьбы с плагиатом, оценки качества переводов и даже для выявления фрагментов, написанных искусственным интеллектом.

Как пояснил автор метода, профессор факультета информационных технологий Борис Рябко, разработка особенно актуальна для образовательной сферы. Университеты и школы ведут постоянную борьбу со списыванием, и новый инструмент позволит не просто искать заимствования, но и анализировать целостность авторского стиля в работе. «Другая, более "прозаическая" область применения – определять части текста, написанного разными авторами», — отметил учёный.

Особенность метода — в его универсальности. Исследователям удалось подобрать минимальный объём текста (в килобайтах), достаточный для анализа, что позволяет работать с языками совершенно разной структуры — от алфавитных систем до китайских иероглифов.

Помимо выявления плагиата, технология предлагает объективный критерий оценки переводов. По словам Рябко, лучшим можно считать тот перевод, который точнее передаёт уникальный авторский стиль оригинала.