Methods and Software for Significant Indicators Determination of the Natural Language Texts Author Profile

dc.contributor.authorShynkarenko, Viktor I.en
dc.contributor.authorDemidovich, Inna M.en
dc.date.accessioned2024-03-12T07:33:31Z
dc.date.available2024-03-12T07:33:31Z
dc.date.issued2023
dc.descriptionV. Shynkarenko: ORCID 0000-0001-8738-7225; I. Demidovich: ORCID 0000-0002-3644-184Xen
dc.description.abstractENG: Methods for the formation and optimization of author profiles are presented. The author profile is an image - a vector in a multidimensional space, which components are author's texts measurements by a number of methods based on 4-grams, stemming, recurrence analysis and formal stochastic grammar. The author's profile is a model of his language, including vocabulary, sentence syntax features. A comparative analysis of the each of the methods effectiveness is carried out. By means of the genetic algorithm, a reduced profile of the author is formed. Insignificant indicators are excluded, which allows to reduce their number by 20%. The reduced author's profile contains attributes that are significant for this author and is an effective attribution of a particular author.en
dc.description.abstractUKR: Наведено методи формування та оптимізації профілів авторів. Профіль автора це образ – вектор у багатовимірному просторі, компоненти якого є вимірами текстів автора рядом методів на основі 4-грам, стемування, рекурентного аналізу та формальної стохастичної граматики. Профіль автора є моделлю його мови, включаючи словниковий запас, особливості синтаксису речень. Проводиться порівняльний аналіз ефективності кожного із методів. Засобами генетичного алгоритму формується усічений профіль автора. Виключаються незначні показники, що дозволяє скоротити їхню кількість на 20%. Усічений профіль автора містить значущу для даного автора атрибутику і є ефективною атрибуцією конкретного автора.uk_UA
dc.identifier.citationShynkarenko V. I., Demydovych I. M. Methods and Software for Significant Indicators Determination of the Natural Language Texts Author Profile. Проблеми програмування. 2023. № 3. P. 22–29. DOI: 10.15407/pp2023.03.22.en
dc.identifier.issn1727-4907
dc.identifier.urihttp://doi.org/10.15407/pp2023.03.22
dc.identifier.urihttps://crust.ust.edu.ua/handle/123456789/18253
dc.language.isoen
dc.publisherІнститут програмних систем НАН України, Київuk_UA
dc.subjectnatural language textsen
dc.subjectauthorship determinationen
dc.subjectgenetic algorithmen
dc.subjectrecurrent analysisen
dc.subjectstatistical analysisen
dc.subjecttext classificationen
dc.subjectpattern recognitionen
dc.subjectformal grammarsen
dc.subjectприродомовні текстиuk_UA
dc.subjectвизначення авторстваuk_UA
dc.subjectгенетичний алгоритмuk_UA
dc.subjectрекурентний аналізuk_UA
dc.subjectстатистичний аналізuk_UA
dc.subjectкласифікація текстівuk_UA
dc.subjectрозпізнавання образівuk_UA
dc.subjectформальні граматикиuk_UA
dc.subjectКІТuk_UA
dc.subject.classificationTECHNOLOGYen
dc.subject.classificationTECHNOLOGY:: Information technology:: Computer scienceen
dc.titleMethods and Software for Significant Indicators Determination of the Natural Language Texts Author Profileen
dc.title.alternativeВизначення значимих показників профілю автора природномових текстівuk_UA
dc.typeArticleen
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Shynkarenko.pdf
Size:
504.49 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: