http://rmid-oecd.asean.org/situs slot gacorlink slot gacorslot gacorslot88slot gacorslot gacor hari inilink slot gacorslot88judi slot onlineslot gacorsitus slot gacor 2022https://www.dispuig.com/-/slot-gacor/https://www.thungsriudomhospital.com/web/assets/slot-gacor/slot88https://omnipacgroup.com/slot-gacor/https://viconsortium.com/slot-online/http://soac.abejor.org.br/http://oard3.doa.go.th/slot-deposit-pulsa/https://www.moodle.wskiz.edu/http://km87979.hekko24.pl/https://apis-dev.appraisal.carmax.com/https://sms.tsmu.edu/slot-gacor/http://njmr.in/public/slot-gacor/https://devnzeta.immigration.govt.nz/http://ttkt.tdu.edu.vn/-/slot-deposit-dana/https://ingenieria.unach.mx/media/slot-deposit-pulsa/https://www.hcu-eng.hcu.ac.th/wp-content/uploads/2019/05/-/slot-gacor/https://euromed.com.eg/-/slot-gacor/http://www.relise.eco.br/public/journals/1/slot-online/https://research.uru.ac.th/file/slot-deposit-pulsa-tanpa-potongan/http://journal-kogam.kisi.kz/public/journals/1/slot-online/https://aeeid.asean.org/wp-content/https://karsu.uz/wp-content/uploads/2018/04/-/slot-deposit-pulsa/https://zfk.katecheza.radom.pl/public/journals/1/slot-deposit-pulsa/https://science.karsu.uz/public/journals/1/slot-deposit-pulsa/ Московский экономический журнал 4/2017 - Московский Экономический Журнал1

Московский экономический журнал 4/2017

УДК 37.022

Bezymyannyj-12

Плотников Андрей Викторович,

кандидат экономических наук,

доцент кафедры менеджмента

ФГБОУ ВО «Пермский государственный аграрно-технологический университет имени академика Д.Н. Прянишникова», г. Пермь

Plotnikov A.V. plotnikov-av@mail.ru

ЭЛЕКТРОННАЯ СИСТЕМА ПОИСКА И ОПРЕДЕЛЕНИЯ ЗАИМСТВОВАНИЙ СЕГМЕНТОВ ТЕКСТА С УЧЕТОМ КРОСС-ЯЗЫКОВОГО ФАКТОРА

ELECTRONIC SEARCH SYSTEM AND DEFINITIONS TEXT PLAGIARISM WITH THE CROSS-LANGUAGE FACTOR

Аннотация

В работе рассматривается система Антиплагиат, описываются характеристики альтернативных онлайн систем проверки текстов на уникальность: Etxt Антиплагиат, Text.Ru, AdvegoPlaguatus, Content-Watch.Ru, DCFinder. Определяются проблемы сервисов по обнаружению антиплагиата со стороны «серых систем» по повышению процента уникальности проверяемого текста. Предлагается алгоритм подготовки текстовой работы к проверке на антиплагиат. Разрабатывается основная концепция нового сервиса, позволяющего проверять кириллические тексты на наличие заимствований в англоязычных источниках.

Summary

The paper examines the «Antiplagiat» («Anti-plagiarism») system, describes the characteristics of alternative online plagiarism checkers: Etxt Antiplagiat, Text.Ru, AdvegoPlagiatus, Content-Watch.Ru, DCFinder. It defines the problems of detecting hidden artificial increase of text uniqueness by «shadowy systems». It proposes an algorithm of preparing the text for plagiarism check. It elaborates the main concept of a new service, which allows to check Cyrillic texts for borrowings from English-language sources.

Ключевые слова: плагиат, антиплагиат, плагиат текста, проверка на антиплагиат, качество образования.

Keywords: plagiarism, anti-plagiarism, plagiarism of the text, verification of anti-plagiarism, quality of education.

Введение

В настоящее время ходит множество споров по поводу заимствования чужих текстов в научных работах В.И. Сперанского [1, С. 252-256.], В.В. Чистякова и Е.В. Ястребовой [2], Е.В. Шараповой [3, С. 215-219]. Данные проблемы нашли свое отражение в научных статьях отечественных авторов. Н.В. Авдеева, О.В. Никулина, А.В. Сазанов [4, С. 49-51] и А.М. Сологубов [5, С. 11-16], Л.Б.  Ситдикова [6, С. 14-19], Г.Ч. Синченко и Н.М. Николаенко [7, С. 49-54] в своих работах обосновали актуальность по поводу использования системы Антиплагиат научно-педагогическими работниками. А.А. Вяткин и А.В. Затонский [8, С. 46-47] предложили оригинальный алгоритм семантически эквивалентного преобразования текстов, позволяющий делать текст неузнаваемым для систем антиплагиата. Таким образом, они определили слабые стороны система Антиплагиат, над которыми нужно серьезно подумать разработчикам.

Иностранные коллеги [9] [10] определили «плагиат» как повторное использование предыдущих идей автора предшествующей работы или даже отдельных фраз текста без указания источника. В работе [11] китайских ученых говорится о различиях в подходе к определению плагиата для американских и китайских академических учреждений. Е.С. Чиркин в своей работе [12] дал определение понятия «плагиат» как умышленное присвоение авторства чужой работы или ее части. Как видно из сравнительной характеристики определений «плагиат» отечественными и зарубежными учеными принципиальной разницы нет. Е.С. Чиркин определил правовое поле ответственности за плагиат – авторские и смежные права. Он указал источник правомерного использования чужой интеллектуальной собственности (ГК РФ, ст. 1274 «Свободное использование произведения в информационных, научных, учебных или культурных целях»), определил способы борьбы с плагиатом в системе образования, методы антиплагиата (анализ множества слов, сравнение строк, межъязыковое определение текста, определение плагиата на основе цитат, стилометрия – анализ стилистики) и плагиата (полное заимствование, замаскированный плагиат, пересказ, перевод, плагиат идей). Что касается плагиата идей, то данный вид плагиата практически невозможно определить без определения других видов плагиата, поскольку идея — это многозначное понятие, не имеющее материальных форм обрамления в отличие от текста, техники, звука и видео. На основе принципов (морфология, нечеткий поиск, шинглы и пассажи) работы систем антиплагиата определенных Е.С.Чиркиным в данной работе будет предложена новая программа для обнаружения заимствований в тексте из англоязычных источников. P. Clough еще в 2003 г. в своей работе [13] предлагает механизм автоматического распознавания текста на наличие заимствований  тексте. Е.С.Чирков провел описательный анализ наиболее известных систем антиплагиата (Антиплагиат от ЗАО «Форексис» (http://antiplagiat.ru/), AdvegoPlaguatus, eTxtАнтиплагиат, ИСКОП – закрытая система). Целевая аудитория сервисов по разпознованию плагиата: академическая среда (заинтересована в проверке учебных и научных работ) и бизнес-среда (заинтересована в проверке текста сайта для лучшего ранжирования поисковыми системами Google и Яндекс –  поисковой оптимизации сайта на основе уникального контента).

В данное время существуют и другие системы по обнаружению заимствований в тексте, такие как Text.Ru, Content-Watch.Ru, DCFinder (Double Content Finder).

Описательный анализ сервисов, определяющих заимствования в тексте

AntiPlagiat.ru. Интернет-сервис AntiPlagiat.ru предназначен для преподавателей и учителей России. Основной функционал интернет-сервиса заключается в реализации проверки текстов на наличие заимствований из общедоступных сетевых источников (статьи, размещенные в Интернете, информация, взятая с сайтов, порталы «в помощь студенту» с готовыми контрольными, рефератами, курсовыми, дипломными работами).[14] Дополнительно подключаются платные услуги: база РГБ, а также нормативно-правовая документация.

eTXT Антиплагиат (Etxt, ETXT) [15] является программой для проверки уникальности контента (для Интернет-оптимизаторов) текста (для обывателей). В данной программу существует 2 режима проверки текста: первый для документов (txt, doc и др.), второй для web-страниц в сети Интернет.  У ETXT Антиплагиат существуют 6 режимов проверки текста на уникальность:

-проверка уникальности – стандартная проверка на уникальность;

-экспресс проверка – ускоренная (упрощенная) проверка текста;

-глубокий анализ – программа проверяет текст с более уточненными требованиями;

-пакетный режим – одновременная проверка нескольких документов на уникальность (до 500 документов);

-проверка сайта – проверяет сразу несколько страниц указанного сайта (по количеству сайтов (web-страниц) ограничений нет, соответственно для данной проверки требуется определенное количество времени);

-сравнение текстов на наличие схожести.

AdvegoPlaguatus имеет дружелюбный интерфейс, работает по тем же принципам, что и Etxt Антиплат. Даннй онлайн сервис афилирован с почти одноименной биржей контента Advego.

Text.Ru Онлайн сервис распознания неуникального контента в интернете, предназачен для SEO-оптимизаторов, копирайтеров. Отличительное преимущество заключается в бесплатной работе сервиса, проверки орфографии в тексте. Методика определяет заимствования после перестановки слов и отдельных фраз местами, игнорирует изменения падежей, времен и других грамматических категорий слова. Данный алгоритм проверки текста на заимствования, принципиально отличающийся от проверки методом шинглов. Таким образом, при некачественном рерайте с изменением каждого пятого или четвертого слова, будет обнаружен заимствованный текст и его источник.

ContentWatch.Ru – независимый инструмент для проверки уникальности текстового контента. Мы не аффилированы ни с одной из бирж контента. С помощью нашего сервиса можно проверить уникальность текста, введенного пользователем, либо уникальность контента сайта, то есть текста, размещенного на отдельной веб-странице (либо на нескольких страницах). Онлайн инструмент предназначен для работников в интернет-среде. Методика проверки отличается от проверки методом шинглов, имеет многоступенчатый алгоритм, позволяющий проверять уникальность быстрее и более точно, чем позволяют другие популярные на сегодняшний день методы [16].

DCFinder – сервис для проверки уникальности текстового контента, аффилирован с биржей копирайтеров Textbroker.ru, имеет схожесть по своему алгоритму проверки текста с онлайн сервисом Advego Plagiatus.

По результатам описательного анализа можно сделать вывод о том, что в академической среде представлен только один сервис Антиплагиат.ру, все остальные сервисы ориентированы на работу с бизнес-сообществом.

Проблемы сервисов по обнаружению антиплагиата

Первая проблема, с которой сталкиваются создатели сервисов и по обнаружению заимствований в тексте – это создание диаметрально противоположных систем (AntiplagiatExspress.ru, Iplag.ru, Antiplagius, AntiplagiatFox, vsesdal.com, furtum.ru, antiplagiatu.net, aplagiat.ru, killer-antiplagiata.ru, author24.ru, plagiatoff.ru и другие сервисы), позволяющих повышать уникальность текста за считанные минуты. Возможно многие из этих систем являются клонами друг друга. Важно обратить внимание на тенденцию появления сервисов с подобным функционалом. Соответственно, производство систем по повышению уникальности текста обусловлена повышенным спросом со стороны учащихся бакалавриата и магистратуры, а значит данный сегмент не заслуживает академической степени или квалификации бакалавра или магистра. Данную проблему можно было бы решить при создании единой базы студенческих выпускных квалификационных работ.

Вторая проблема заключается в искажении и замещении транслитизационного текста учащимися для прохождения проверки с успешным результатом. Далее в данной работе будет предложен алгоритм проверки транслитизационного текста на наличие заимствований.

Концепция нового сервиса, позволяющего проверять кириллические тексты на наличие заимствований у англоязычных источников

Данная концепция основана на результатах работы Nava Ehsan и Azadeh Shakery [17], в которой рассматривается особенность поиска заимствований текста с учетом кросс-языкового фактора. Кросс-языковому поиску заимствований посвящена следующая работа [18] авторов Marc Franco-Salvador, Paolo Rosso и Manuel Montes-y-Gómez, в которой авторы уделили внимание лексической многозначности фраз в зависимости от конкретного языка.

В другой работе [19] авторы (Marc Franco-Salvador и соавторы) предложили гибридные модели для оценки семантического сходства двух сегментов текста на разных языках (испанско-английский и русско-английский).

На основе актуальности программного обеспечения, позволяющего определять некорректные заимствования был создан первичный рабочий прототип, позволяющий выполнять общую последовательность действий:

Копирование и вставка русского текста в интерфейс системы

Автоматический перевод текста с русского языка на английский язык (через API Google Translate)

Проверка полученной англоязычной семантики на наличие заимствований в сети Интернет по англоязычным базам: открытые источники Интернет в том числе файлы в форматах pdf doc docx ppt pptx + база цитирования google scholar (примечание: если перевести с русского языка на английский язык текст в автоматическом переводчике, то около 50% семантики будет схожей с «ручным» переводом)

Составление отчета с подсветкой заимствований. Основным результатом работы Программы является отчет о проверке документа. В отчете отмечаются те фрагменты проверяемого документа, найденные в текстовых базах. Частичный функционал заимствован из сервиса Система Антиплагиат.МГУ.[20]

Screenshot_1

Рисунок 1. Алгоритм подготовки текстовой работы к проверке на антиплагиат

В данной работе не рассматривается использование нескольких баз текстовых данных, работа со статистическими отчетами, личным кабинетом пользователя, так как данная система является прототипом с ограниченным функционалом.

Заключение

Предложенная программа предназначена для поиска некорректных заимствований учебного и научного плагиата у магистрантов, аспирантов, докторантов и может стать основной проверки русскоязычных текстов учебных и научных работ на наличие заимствований в англоязычных источниках. Принцип работы Программы – автоматический перевод текста на английский язык и сопоставление англоязычного текста с базой источников в сети Интернет с целью обнаружения в них идентичных сегментов фраз, предложений или отдельных абзацев.

Целью проверяющего является на основе созданного программой отчета принять дальнейшее положительное или отрицательное решение по данной работе.

В перспективе появится интеграция с другими текстовыми библиотеками для более точного определения заимствований и возможность работы со статистическими отчетами. Для регистрации пользователей в Программе, планируется использование уже известных решений. Внедрение информирования проверяющих о попытках «обмана» со стороны проверяемых на основе замены русских символов на латиницу «A B C E P M O H y u X K» без изменения их смыслового содержания с целью повышения оценки оригинальности текста.

Литература

  1. Сперанский В.И. «Антиплагиат» — безупречная ли программа? // Социально-гуманитарные знания. 2014. № 1. С. 252-256.
  2. Чистяков В.В., Ястребова Е.В. О применении системы Антиплагиат // Пробелы в российском законодательстве. 2013. № 1. С. 203.
  3. Шарапова Е.В. Исследование возможностей системы «Антиплагиат» для обнаружения заимствований // Перспективы науки и образования. 2013. № 3. С. 215-219.
  4. Авдеева Н.В., Никулина О.В., Сазанов А.В. «Антиплагиат.РГБ»: найти и обезвредить // Университетская книга. 2012. Т. окт. № 8. С. 49-51.
  5. Авдеева Н.В., Никулина О.В., Сологубов А.М. Система «Антиплагиат.РГБ» и недобросовестные авторы диссертаций: кто победит? // Научная периодика: проблемы и решения. 2012. № 5. С. 11-16
  6. Ситдикова Л.Б. Внедрение программы «Антиплагиат» в систему российского образования // Право и образование. 2012. № 12. С. 14-19
  7. Синченко Г.Ч., Николаенко Н.М. Плагиат — Контрплагиат — Антиплагиат // Научный вестник Омской академии МВД России. 2013. № 3 (50). С. 49-54
  8. Вяткин А.А., Затонский А.В. Алгоритм противодействия системе Антиплагиат // Вестник КИГИТ. 2012. № 7 (25). С. 46-47.
  9. Park C. In other (people’s) words: Plagiarism by university students—literature and lessons //Assessment & evaluation in higher education. – 2003. – Т. 28. – №. 5. – С. 471-488.
  10. Asad Abdi, Norisma Idris, Rasim M. Alguliyev, Ramiz M. Aliguliyev, PDLK: Plagiarism detection using linguistic knowledge, Expert Systems with Applications, Volume 42, Issue 22, 2015, PP. 8936-8946. http://dx.doi.org/10.1016/j.eswa.2015.07.048.
  11. Guangwei Hu, Jun Lei, Plagiarism in English academic writing: A comparison of Chinese university teachers’ and students’ understandings and stances, System, Volume 56, 2016, PP. 107-118. http://dx.doi.org/10.1016/j.system.2015.12.003.
  12. Чиркин Е.С. Использование систем антиплагиата в образовании // Вестник Тамбовского университета. Серия: Естественные и технические науки. 2013. №6 (2) С.3380-3387.
  13. Clough P. et al. Old and new challenges in automatic plagiarism detection //National Plagiarism Advisory Service, 2003; http://ir. shef. ac. uk/cloughie/index. html. – 2003.
  14. Система анализа текстов на наличие заимствований [Электронный ресурс] URL: http://www.antiplagiat.ru/index.aspx
  15. Проверка на уникальность с eTXT Антиплагиат [Электронный ресурс] URL: http://zone-pc.ru/index.php/soft/etxt-antiplagiat/
  16. Описание сервиса Content Watch: https://content-watch.ru/about/
  17. Nava Ehsan, Azadeh Shakery, Candidate document retrieval for cross-lingual plagiarism detection using two-level proximity information, Information Processing & Management, Vol. 52, 6, November 2016, PP. 1004-1017, http://dx.doi.org/10.1016/j.ipm.2016.04.006.
  18. Marc Franco-Salvador, Paolo Rosso, Manuel Montes-y-Gómez, A systematic study of knowledge graph analysis for cross-language plagiarism detection, Information Processing & Management, Volume 52, Issue 4, 2016, PP. 550-570. http://dx.doi.org/10.1016/j.ipm.2015.12.004.
  19. Marc Franco-Salvador, Parth Gupta, Paolo Rosso, Rafael E. Banchs, Cross-language plagiarism detection over continuous-space- and knowledge graph-based representations of language, Knowledge-Based Systems, Volume 111, 2016, PP. 87-99, http://dx.doi.org/10.1016/j.knosys.2016.08.004.
  20. Система Антиплагиат.МГУ. – М.: МГУ, 2009. www.msu.ru/projects/antiplagiat/info/antiplagiat-sistema.doc