Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://e-lib.bsufl.by/handle/edoc/17803
Название: Лексико-семантические отношения в корпусах и языковых моделях для белорусского языка
Другие названия: Lexical-Semantic Relations In Corpora And Language Models For The Belarusian Language
Авторы: Астапенко, Е. В.
Митрофанова, О. А.
Ключевые слова: Языкознание (лингвистика)
Прикладное языкознание
Перевод
Белорусский язык
Дата публикации: 2025
Издатель: Белорусский государственный университет иностранных языков
Библиографическое описание: Астапенко, Е. В. Лексико-семантические отношения в корпусах и языковых моделях для белорусского языка / Е. В. Астапенко, О. А. Митрофанова // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : сб. науч. ст. по итогам II междунар. науч. конф., Минск, 23–24 окт. 2025 г. / редкол. : Н. Е. Лаптева (отв. ред.) [и др.]. – Минск : БГУИЯ, 2025. – С. 147–153.
Аннотация: В данной работе исследуется способность языковых моделей фиксировать семантические связи между словами. Описаны эксперименты по автоматическому предсказанию лексико-семантических отношений в белорусском языке с помощью различных моделей, а именно Word2Vec, BERT и генеративных языковых моделей. Качество предсказаний моделей определялось с помощью процедуры псевдодизамбигуации (Word2Vec) и экспертной оценки (BERT, Gemini 2.5 Pro). Полученные результаты могут быть применены для решения различных задач: для создания и обогащения лексических баз данных, исследования сочетаемости слов, улучшения машинного перевода, перефразирования, реферирования и других систем автоматической обработки белорусского языка. Ключевые слова: лексико-семантические отношения; белорусский язык; Word2Vec; BERT; большие языковые модели.
Описание: Astapenka L., Mitrofanova О. Our study examines the ability of language models to capture semantic relations between words. We describe experiments on automatic prediction of lexical-semantic relations in the Belarusian language using various models (Word2Vec, BERT, and generative language models). The performance of the models was evaluated by pseudo-disambiguation test (Word2Vec) as well as by expert evaluation method (BERT, Gemini 2.5 Pro). The results can be applied to create and enrich lexical databases, to analyse word co-occurrence, to improve machine translation, paraphrasing, summarization, and other systems related to automatic processing of the Belarusian language. Key words: lexical-semantic relations; the Belarusian language; Word2Vec; BERT; large language models.
URI: http://e-lib.bsufl.by/handle/edoc/17803
ISBN: 978-985-28-0275-8
Располагается в коллекциях:Язык в эпоху цифровых трансформаций и развития искусственного интеллекта (статьи)

Файлы этого ресурса:
Файл Описание РазмерФормат 
147-153.pdf7,7 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.