Please use this identifier to cite or link to this item: http://e-lib.bsufl.by/handle/edoc/17872
Title: Авторство студенческого академического текста: проблема идентификации
Other Titles: The Authorship Of A Student Academic Text: An Identification Problem
Authors: Полунина, Л. Н.
Keywords: Языкознание (лингвистика)
Прикладное языкознание
Информатика и информационные технологии
Issue Date: 2025
Publisher: Белорусский государственный университет иностранных языков
Citation: Полунина, Л. Н. Авторство студенческого академического текста: проблема идентификации / Л. Н. Полунина // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : сб. науч. ст. по итогам II междунар. науч. конф., Минск, 23–24 окт. 2025 г. / редкол. : Н. Е. Лаптева (отв. ред.) [и др.]. – Минск : БГУИЯ, 2025. – С. 645–652.
Abstract: Большие языковые модели (LLM) представляют собой значительный шаг вперед в области обработки естественного языка. Предварительное обучение на обширных корпусах текстов позволяет им демонстрировать исключительную способность генерировать высококачественный контент и универсальность при создании текстов самого разного стиля. Однако функциональные возможности больших языковых моделей порождают серьезные этические вопросы. Их способность создавать связные и контекстно-адекватные тексты повышает риск потенциального злоупотребления, включая плагиат и нарушение авторских прав. В статье представлены результаты исследования выпускных квалификационных работ студентов бакалавриата на наличие контента, сгенерированного искусственным интеллектом (ИИ). Выборку составили 20 реальных текстовых образцов в 200 слов и 20 соответствующих им по тематике и объему сгенерированных текстов. Для генерирования и анализа текстов использовались нейросеть GigaChat 2.0, а также ИИ-детекторы GigaCheck и isgen.ai. На основе сопоставительного анализа студенческих и ИИ-текстов описаны основные лингвистические особенности сгенерированного академического контента, среди которых дробная композиция, слабая когезия, отсутствие сложной научной терминологии, простой синтаксис, повторы, фейковые цитаты. Ключевые слова: большие языковые модели; сгенерированный академический контент; ИИ-текст.
Description: Polunina L. Large language models (LLMs) represent a substantial advancement in the domain of natural language processing. Pre-trained on large text corpora, they demonstrate exceptional ability to generate high-quality content and versatility in creating texts of a wide range of styles. However, the functionality of large language models raises serious ethical questions. Their ability to generate coherent and contextually relevant texts increases the risk of potential misuse, including plagiarism and copyright infringement. This paper presents the results of a study of undergraduate students’ theses for the presence of content generated by artificial intelligence (AI). The sample consisted of 20 real text excerpts of 200 words and 20 generated corresponding texts in terms of topic and volume. The texts were generated and analyzed with the GigaChat 2.0 neural network and the GigaCheck and isgen.ai AI detectors. A comparative analysis of student and AI texts enabled revealing the main linguistic features of generated academic content, including fractional composition, weak cohesion, lack of complex scientific terms, simple syntax, repetitions, and fake quotations. Key words: large language models; generated academic content; AI text.
URI: http://e-lib.bsufl.by/handle/edoc/17872
ISBN: 978-985-28-0275-8
Appears in Collections:Язык в эпоху цифровых трансформаций и развития искусственного интеллекта (статьи)

Files in This Item:
File Description SizeFormat 
645-652.pdf8,37 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.