Розробка засобів підбору та перевірки коректності УДК-шифрів наукових робіт

dc.contributor.authorСафонов, Данило Євгеновичuk_UA
dc.date.accessioned2023-11-03T12:35:14Z
dc.date.available2023-11-03T12:35:14Z
dc.date.issued2023
dc.description.abstractUKR: Предметом розробки є система підбору та перевірки коректності УДК- шифрів наукових робіт. Мета роботи полягає у розробці програмного забезпечення для підбору та перевірки коректності УДК-шифрів наукових робіт. Основними задачами є розробка та реалізація: • засобів попередньої обробки та токенізації текстів; • моделі УДК, яка містить класи та ключові та слова, та засобів їїнаповнення шляхом тренувань; • засобів підбору та перевірки коректності УДК-шифру на основі розробленої моделі. Методи розв’язання задачі. Для реалізації системи застосовано об’єктно- орієнтований (ОО) підхід до проектування з використанням UML та ОО програмування мовою Python. Для обробки текстів використано алгоритми токенізація, видалення стоп слів, розмічування частин мови та іменованих сутностей, побудовані на основі компонентів бібліотеки spaCy. Отримані результати. Розроблено настільний додаток з CLI для підбору та перевірки коректності УДК-шифрів для англомовних текстів. Значення роботи. Додаток може бути корисним для часткової автоматизації класифікації великих бібліотек: результати ручної класифікації застосовуються для навчання моделі, для класифікації решти використовуються рекомендації програми. У розділі висновків наведено пропозиції щодо подальшого розвитку та покращення роботи додатку. Пояснювальна записка складається з семи розділів, переліку умовних познак, списку використаної літератури та додатків. Загальний обсяг: 83 с., 16 рис., 4 табл., 1 додаток, 101 джерел.uk_UA
dc.description.abstractENG: Development object is a tool for selection and verification of UDC codes of scientific works. The purpose of the work is to develop tool for selection and verification of UDC codes of scientific works. The main tasks are development and implementation of: • tools for pre-processing and tokenization of texts; • UDC model, that would consist of classes, keywords, and means of training that model; • tool for selection and verification of UDC codes of scientific works based on the developed model. Problem solving methods. The system is developed with object-oriented (OO) methodology, using UML and OO-programming in Python language. Texts are processed with tokenization, stop-word removal, part-of-speech tagging, and named-entity recognition algorithms, based on components of spaCy library. Obtained results. A desktop app with CLI for selection and verification of UDC codes of scientific works was developed. Value of the work. The application can be used for partial optimization of big libraries: results of manual classifications are used for model training, and the rest of the texts are classified with aid of the program. The summary has propositions for further imporvment of the app. The explanatory note consists of 7 chapters, list of symbolic markers, list of references, and appendices. Total volume: 83 pages, 16 drawings, 4 tables, 1 appendix, 101 references.en
dc.identifier.citationСафонов Д. Є. Розробка засобів підбору та перевірки коректності УДК шифрів наукових робіт : дипломна робота на здобуття кваліфікаційного ступеня бакалавра : спец. 121 – Інженерія програмного забезпечення / наук. керівник О. С. Куроп’ятник ; Укр. держ. ун-т науки і технологій. Дніпро, 2023. 80 с.uk_UA
dc.identifier.urihttps://crust.ust.edu.ua/handle/123456789/17711
dc.language.isouk
dc.publisherУкраїнський державний університет науки і технологій, Дніпроuk_UA
dc.subjectмашинне навчанняuk_UA
dc.subjectобробка природної мовиuk_UA
dc.subjectУДКuk_UA
dc.subjectінтерфейс командного рядкаuk_UA
dc.subjectітераційна розробкаuk_UA
dc.subjectавтоматизаціяuk_UA
dc.subjectPYTHONen
dc.subjectSPACYen
dc.subjectmachine learningen
dc.subjectnatural language processingen
dc.subjectUDCen
dc.subjectcommand line interfaceen
dc.subjectiterative developmenten
dc.subjectautomationen
dc.subjectВКРuk_UA
dc.subjectКІТuk_UA
dc.subject.classificationTECHNOLOGYen
dc.subject.classificationTECHNOLOGY:: Information technology:: Computer scienceen
dc.titleРозробка засобів підбору та перевірки коректності УДК-шифрів наукових робітuk_UA
dc.title.alternativeDevelopment of Tools for Selection and Verification of UDC Codes of Scientific Worksen
dc.typeBachelor Thesisen
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Safonov_dip_2023.pdf
Size:
1.45 MB
Format:
Adobe Portable Document Format
Description:
Bachelor Thesis
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: