Artificial Intelligence and Machine Learning Algorithms for Assessing the Authenticity of a Scientific Article in Scopus: Translator's Experience

Loading...
Thumbnail Image
Date
2022
Journal Title
Journal ISSN
Volume Title
Publisher
Ukrainian State University of Science and Technologies, Dnipro
Abstract
ENG: Objective. This paper examines ways to solve the problem of cross-language plagiarism in scientific works written in Ukrainian, which are to be translated and published in English. Considering that Ukrainian university libraries are directly involved in the practices of improving the level of awareness of lecturers and scientists, as well as their support of a large number of new digital tools, we draw attention to the emergence of new opportunities in the practices of supporting academic integrity. Methods. Big Data mining techniques and analysis of algorithms underlying machine translation software were employed to identify the cases of cross-language plagiarism in scientific articles originally written in the Ukrainian language. Results. Based on the analysis of 4000 translated manuscripts, it was established that the standard Microsoft Word 2022 software, typically used to write an article, identifies with a very high accuracy those parts of the text that had been earlier published and stored in a digital format. Conclusions. With the advent of Microsoft Office 365 software (released in 2022), it becomes possible to check any article originally written in Ukrainian or Russian, while being translated into English, for similarities with previously published academic papers. This allows for an instantaneous correction check that may prove useful in preventing the intended or unintended occurrence of cross-language plagiarism in scientific papers. It is advisable to more actively involve librarians of Ukrainian universities in using the powerful potential of digital support for the research activities of their users, including writing papers and checking them for signs of plagiarism.
UKR: Мета. У статті розглядаються шляхи вирішення проблеми міжмовного плагіату в наукових роботах, написаних українською мовою, які підлягають перекладу та публікації англійською мовою. Методика. Для виявлення випадків міжмовного плагіату в наукових статтях, написаних українською мовою, було використано методи опрацювання великих даних та аналіз алгоритмів програмного забезпечення машинного перекладу. Результати. На основі аналізу 4000 перекладених рукописів встановлено, що стандартне програмне забезпечення Microsoft Word 2022, яке зазвичай використовується для написання статті, з дуже високою точністю визначає ті частини тексту, які раніше були опубліковані та збережені в цифровому форматі. Висновки. З появою програмного забезпечення Microsoft Office 365 (випущеного у 2022 році) з’явилася можливість перевірити будь-яку статтю, оригінально написану українською чи російською мовою, з одночасним перекладом на англійську, на схожість із раніше опублікованими науковими статтями. Це дозволяє миттєво перевірити наукову працю, що може виявитися корисним для запобігання навмисному чи ненавмисному виникненню міжмовного плагіату в наукових статтях. Доцільно активніше залучати бібліотекарів українських університетів до використання потужного потенціалу цифрової підтримки науково-дослідницької діяльності своїх користувачів, у т.ч. написання робіт та перевірки їх на ознаки плагіату.
Description
V. Osadchyi: ORCID 0000-0003-4242-6328; O. Osadcha: ORCID 0000-0003-1414-6345
Keywords
cross-language plagiarism, university libraries, academic paper in the Ukrainian language, Scopus, Microsoft Office 365 software, translation from Ukrainian into English, міжмовний плагіат, наукова робота українською мовою, програмне забезпечення Microsoft Office 365, переклад з української мови на англійську
Citation
Osadchyi V. I., Osadcha O. V. Artificial Intelligence and Machine Learning Algorithms for Assessing the Authenticity of a Scientific Article in Scopus: Translator's Experience. University Library at a New Stage of Social Communications Development. Conference Proceedings. 2022. No. 7. Р. 135–140. DOI: 10.15802/unilib/2022_270630.
Collections