Проблемы выявления плагиата и анализ инструментального программного обеспечения для их решения

Loading...
Thumbnail Image
Date
2017
Journal Title
Journal ISSN
Volume Title
Publisher
Днепропетровский национальный университет железнодорожного транспорта имени академика В. Лазаряна, Днепр
Abstract
RUS: Цель. Данное исследование направлено на: 1) определение понятия «плагиата» в текстах на формальных и естественных языках, построение таксономии плагиата; 2) выявление основных проблем обнаружения плагиата при использовании автоматизированных средств их решения; 3) анализ и систематизацию информации, полученной в ходе обзора, тестирования и анализа работы существующих систем обнаружения заимствований. Методика. Для выявления требований к программному обеспечению по обнаружению плагиата применяются методы анализа нормативной документации (законодательной базы) и конкурентного инструментария. Для проверки требований используются методы тестирования и обзора интерфейсов GUI. Результаты. В работе рассмотрено понятие «плагиата», вопросы его распространения и классификации. Выполнен обзор существующих систем выявления плагиата: настольных приложений и онлайн-ресурсов. Выделены их функциональных характеристики, определены форматы входных и выходных данных и ограничения на них, особенности настройки и доступа. Выполнена детализация требований к рассмотренным системам. Научная новизна. Авторами предложено дополнение к существующим иерархическим схемам таксономии плагиата. Выполнен анализ существующих систем с точки зрения функциональности и возможности использования для больших объемов данных. Практическая значимость. Практическая значимость определяется широтой проблемы плагиата в различных сферах. В Украине развивается законодательная база для борьбы с плагиатом, что требует активного решения задач разработки, совершенствования и внедрения соответствующего программного обеспечения (ПО). Данная работа способствует решению указанных задач. Обзор существующих программ-антиплагиатов, а также изучение и исследование опыта в этой области, уточнение понятия «плагиата», стратегии его выявления позволяет более полно сформулировать требования к функциональным характеристикам, входным и выходным данным разрабатываемого ПО, а также выявить особенности работы подобного ПО. В статье сделан акцент на особенности решения задачи выявления заимствований в академической среде.
UKR: Мета. Дане дослідження спрямоване на: 1) визначення поняття «плагіату» в текстах на формальних і природних мовах, побудова таксономії плагіату; 2) встановлення основних проблем виявлення плагіату і використання автоматизованих засобів їх вирішення; 3) аналіз та систематизацію інформації, отриманої у ході огляду, тестування і аналізу роботи існуючих систем виявлення запозичень. Методика. Для формулювання вимог до програмного забезпечення з виявлення плагіату застосовуються методи аналізу нормативної документації (законодавчої бази) і конкурентного інструментарію. Для перевірки вимог використовуються методи тестування та огляду інтерфейсів GUI. Результати. У роботі розглянуто поняття «плагіату», питання його поширення та класифікації. Виконано огляд існуючих систем виявлення плагіату: настільних додатків та онлайн-ресурсів. Виділено їх функціональні характеристики, визначені формати вхідних та вихідних даних і обмеження на них, особливості налаштування і доступу. Виконана деталізація вимог до розглянутих систем. Наукова новизна. Авторами запропоновано доповнення до існуючих ієрархічних схем таксономії плагіату. Виконано аналіз існуючих систем із точки зору функціональності та можливості використання для великих обсягів даних. Практична значимість. Практична значимість визначається широтою проблеми плагіату в різних сферах. В Україні розвивається законодавча база для боротьби з плагіатом, що вимагає активного вирішення завдань розробки, вдосконалення та впровадження відповідного програмного забезпечення (ПЗ). Дана робота сприяє вирішенню зазначених завдань. Огляд існуючих програм-антиплагіатів, а також вивчення і дослідження досвіду в цій галузі, уточнення поняття «плагіату», стратегії його виявлення дозволяє більш повно сформулювати вимоги до функціональних характеристик, вхідних і вихідних даних розроблюваного ПЗ, а також виявити особливості роботи подібного ПЗ. У статті зроблено акцент на особливості вирішення завдання виявлення запозичень в академічному середовищі.
ENG: Purpose. This study is aimed at: 1) the definition of plagiarism in texts on formal and natural languages, building a taxonomy of plagiarism; 2) identify major problems of plagiarism detection when using automated tools to solve them; 3) Analysis and systematization of information obtained during the review, testing and analysis of existing detection systems. Methodology. To identify the requirements of the software to detect plagiarism apply methods of analysis of normative documentation (legislative base) and competitive tools. To check the requirements of the testing methods used and GUI interfaces review. Findings. The paper considers the concept of plagiarism issues of proliferation and classification. A review of existing systems to identify plagiarism: desktop applications, and online resources. Highlighting their functional characteristics, determine the format of the input and output data and constraints on them, customization features and access. Drill down system requirements is made. Originality. The authors proposed schemes complement the existing hierarchical taxonomy of plagiarism. Analysis of existing systems is done in terms of functionality and possibilities for use of large amounts of data. Practical value. The practical significance is determined by the breadth of the problem of plagiarism in various fields. In Ukraine, develops the legal framework for the fight against plagiarism, which requires the active solution development tasks, improvement and delivery of relevant software (PO). This work contributes to the solution of these problems. Review of existing programs, Anti-plagiarism, as well as study and research experience in the field and update the concept of plagiarism, the strategy allows it to identify more fully articulate to the functional performance requirements, the input and output of the developed software, as well as to identify the features of such software. The article focuses on the features of solving the problem of identification of borrowing in an academic environment.
Description
В. Шинкаренко: ORCID 0000-0001-8738-7225; Е. Куропятник: ORCID 0000-0003-2286-884X
Keywords
плагиат, таксономия плагиата, заимствование фрагментов, системы обнаружения плагиата, плагіат, таксономія плагіату, запозичення фрагментів, системи виявлення плагіату, plagiarism, taxonomy of plagiarism, borrowing fragments, plagiarism detection system, КІТ
Citation
Шинкаренко, В. И. Проблемы выявления плагиата и анализ инструментального программного обеспечения для их решения / В. И. Шинкаренко, Е. С. Куропятник // Наука та прогрес транспорту. – 2017. – № 1 (67). – С. 131–142. – DOI: 10.15802/stp2017/94034.