Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://e-lib.bsufl.by/handle/edoc/17872
Название: Авторство студенческого академического текста: проблема идентификации
Другие названия: The Authorship Of A Student Academic Text: An Identification Problem
Авторы: Полунина, Л. Н.
Ключевые слова: Языкознание (лингвистика)
Прикладное языкознание
Информатика и информационные технологии
Дата публикации: 2025
Издатель: Белорусский государственный университет иностранных языков
Библиографическое описание: Полунина, Л. Н. Авторство студенческого академического текста: проблема идентификации / Л. Н. Полунина // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : сб. науч. ст. по итогам II междунар. науч. конф., Минск, 23–24 окт. 2025 г. / редкол. : Н. Е. Лаптева (отв. ред.) [и др.]. – Минск : БГУИЯ, 2025. – С. 645–652.
Аннотация: Большие языковые модели (LLM) представляют собой значительный шаг вперед в области обработки естественного языка. Предварительное обучение на обширных корпусах текстов позволяет им демонстрировать исключительную способность генерировать высококачественный контент и универсальность при создании текстов самого разного стиля. Однако функциональные возможности больших языковых моделей порождают серьезные этические вопросы. Их способность создавать связные и контекстно-адекватные тексты повышает риск потенциального злоупотребления, включая плагиат и нарушение авторских прав. В статье представлены результаты исследования выпускных квалификационных работ студентов бакалавриата на наличие контента, сгенерированного искусственным интеллектом (ИИ). Выборку составили 20 реальных текстовых образцов в 200 слов и 20 соответствующих им по тематике и объему сгенерированных текстов. Для генерирования и анализа текстов использовались нейросеть GigaChat 2.0, а также ИИ-детекторы GigaCheck и isgen.ai. На основе сопоставительного анализа студенческих и ИИ-текстов описаны основные лингвистические особенности сгенерированного академического контента, среди которых дробная композиция, слабая когезия, отсутствие сложной научной терминологии, простой синтаксис, повторы, фейковые цитаты. Ключевые слова: большие языковые модели; сгенерированный академический контент; ИИ-текст.
Описание: Polunina L. Large language models (LLMs) represent a substantial advancement in the domain of natural language processing. Pre-trained on large text corpora, they demonstrate exceptional ability to generate high-quality content and versatility in creating texts of a wide range of styles. However, the functionality of large language models raises serious ethical questions. Their ability to generate coherent and contextually relevant texts increases the risk of potential misuse, including plagiarism and copyright infringement. This paper presents the results of a study of undergraduate students’ theses for the presence of content generated by artificial intelligence (AI). The sample consisted of 20 real text excerpts of 200 words and 20 generated corresponding texts in terms of topic and volume. The texts were generated and analyzed with the GigaChat 2.0 neural network and the GigaCheck and isgen.ai AI detectors. A comparative analysis of student and AI texts enabled revealing the main linguistic features of generated academic content, including fractional composition, weak cohesion, lack of complex scientific terms, simple syntax, repetitions, and fake quotations. Key words: large language models; generated academic content; AI text.
URI: http://e-lib.bsufl.by/handle/edoc/17872
ISBN: 978-985-28-0275-8
Располагается в коллекциях:Язык в эпоху цифровых трансформаций и развития искусственного интеллекта (статьи)

Файлы этого ресурса:
Файл Описание РазмерФормат 
645-652.pdf8,37 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.