Please use this identifier to cite or link to this item: http://e-lib.bsufl.by/handle/edoc/17854
Title: Опыт тематического моделирования и кластеризации в исследовании виртуального медиадискурса
Other Titles: Experience In Topic Modeling And Clustering In Research Of Virtual Media Discourse
Authors: Шишкин, Б. А.
Keywords: Языкознание (лингвистика)
Прикладное языкознание
Перевод
Issue Date: 2025
Publisher: Белорусский государственный университет иностранных языков
Citation: Шишкин, Б. А. Опыт тематического моделирования и кластеризации в исследовании виртуального медиадискурса / Б. А. Шишкин // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : сб. науч. ст. по итогам II междунар. науч. конф., Минск, 23–24 окт. 2025 г. / редкол. : Н. Е. Лаптева (отв. ред.) [и др.]. – Минск : БГУИЯ, 2025. – С. 471–477.
Abstract: В данной работе рассматривается контаминированный подход к проведению тематического моделирования и кластеризации текстов сетевого пространства с целью осуществления комплексного исследования виртуального медиадискурса. Базой исследования выступили отобранные методом сплошной выборки публикации из сетевого сообщества Северного Кавказа. Приводится опыт реализации автоматизированной систематизации эмпирического материала при помощи TF-IDF векторизации, кластеризации методом К-средних (k-means) и алгоритма тематического моделирования NMF. Выявляются сильные и слабые стороны данных подходов к анализу эмпирического материала. Отдельно отражается перспективность и эффективность дополнительного использования больших языковых моделей как инструмента автоматического именования сформированных кластеров и тематик. В заключении отмечается высокий потенциал данного подхода к комплексному рассмотрению состава сетевого пространства Северного Кавказа, что также служит основой для будущих исследований в области социолингвистки, лингвостатистики и иных направлений изучения виртуального медиадискурса. Ключевые слова: тематическое моделирование; кластеризация; сетевое пространство; виртуальность; медиадискурс; К-средних; NMF.
URI: http://e-lib.bsufl.by/handle/edoc/17854
ISBN: 978-985-28-0275-8
Appears in Collections:Язык в эпоху цифровых трансформаций и развития искусственного интеллекта (статьи)

Files in This Item:
File Description SizeFormat 
471-477.pdf7,34 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.