Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://eadnurt.diit.edu.ua/jspui/handle/123456789/13850
Назва: Automation of Template Formation to Identify the Structure of Natural Language Documents
Інші назви: Автоматизація формування шаблону для визначення структури документів на натуральній мові
Автоматизация формирования шаблона для определения структуры документов на натуральном языке
Автори: Kuropiatnyk, Olena S.
Shynkarenko, Viktor I.
Ключові слова: natural language
document comparison
plagiarism detection
document structure
document template
constructive-synthesizing modeling
constructor
структура документу
шаблон документу
конструктивно-синтезуюче моделювання
конструктор
естественный язык
сравнение документов
обнаружение плагиата
конструктивно-синтезирующее моделирование
КІТ
Дата публікації: 2021
Видавництво: CEUR-WS Team, Aachen, Germany
Бібліографічний опис: Kuropiatnyk, O., Shynkarenko V. Automation of template formation to identify the structure of natural language documents. CEUR Workshop Proceedings. 2021. Vol. 2870 : 5th International Conference on Computational Linguistics and Intelligent Systems. Vol. I: Main Conference, COLINS 2021, 22–23 April 2021. P. 179–190.
Короткий огляд (реферат): EN: In the task of text borrowings and plagiarism detection, it is important to take into account the structure of the document. This allows getting a more accurate assessment of the text and reducing the volume of material for comparison. Using a template allows identifying the structure of the document. The paper presents a constructive synthesizing model for automating the construction of a structural template of a document. Possible implementations of some algorithms by means of programming in C# are considered. Their comparative assessment is performed. Possible modification of the template is presented to increase the importance of keywords and simplify the xml-tree, which is a template.
UK: У задачі із запозичення тексту і виявлення плагіату важливо враховувати структуру документа. Це дозволяє отримати більш точну оцінку тексту і зменшити обсяг матеріалу для порівняння. Використання шаблону дозволяє визначити структуру документа. У статті представлена конструктивна синтезуюча модель для автоматизації побудови структурного шаблону документа. Розглянуто можливі реалізації деяких алгоритмів засобами програмування на C #. Проведена їх порівняльна оцінка. Можлива модифікація шаблону представлена для збільшення важливості ключових слів і спрощення xml-дерева, яке є шаблоном.
RU: В задаче по заимствованию текста и обнаружению плагиата важно учитывать структуру документа. Это позволяет получить более точную оценку текста и уменьшить объем материала для сравнения. Использование шаблона позволяет определить структуру документа. В статье представлена конструктивная синтезирующая модель для автоматизации построения структурного шаблона документа. Рассмотрены возможные реализации некоторых алгоритмов средствами программирования на C #. Проведена их сравнительная оценка. Возможная модификация шаблона представлена для увеличения важности ключевых слов и упрощения xml-дерева, которое является шаблоном.
Опис: O. Kuropiatnyk: ORCID 0000-0003-2286-884x; V. Shynkarenko: 0000-0001-8738-7225
URI (Уніфікований ідентифікатор ресурсу): http://eadnurt.diit.edu.ua/jspui/handle/123456789/13850
http://ceur-ws.org/Vol-2870/
http://ceur-ws.org/Vol-2870/paper17.pdf
ISSN: 1613-0073
Розташовується у зібраннях:Статті КІТ

Файли цього матеріалу:
Файл Опис РозмірФормат 
Kuropiatnyk 17.pdf1,33 MBAdobe PDFПереглянути/Відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.