Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://e-lib.bsufl.by/handle/edoc/17805
Название: Оценка качества русскоязычных автоматических рефератов с применением метрик на базе n-грамм (на материале научных текстов из области ИКТ)
Другие названия: Quality Evaluation Of Russian -Language Automatic Summaries With N-Gram Metrics (based on ICT Scientific Texts)
Авторы: Василевская, В. М.
Ключевые слова: Языкознание (лингвистика)
Прикладное языкознание
Перевод
Дата публикации: 2025
Издатель: Белорусский государственный университет иностранных языков
Библиографическое описание: Василевская, В. М. Оценка качества русскоязычных автоматических рефератов с применением метрик на базе n-грамм (на материале научных текстов из области ИКТ) / В. М. Василевская // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : сб. науч. ст. по итогам II междунар. науч. конф., Минск, 23–24 окт. 2025 г. / редкол. : Н. Е. Лаптева (отв. ред.) [и др.]. – Минск : БГУИЯ, 2025. – С. 162–169.
Аннотация: В данной статье проведен анализ применимости основанных на n-граммах метрик BLEU и ROUGE для оценки автоматически сгенерированных рефератов русскоязычных научных статей в области информационно-коммуникационных технологий (ИКТ). Выделены связанные со спецификой функционирования метрик проблемы, касающиеся русского языка и русскоязычных научных текстов, в частности, текстов из области ИКТ. Сделан вывод о недостаточной достоверности предоставленной данными метриками оценки качества русскоязычных научных рефератов ИКТ-текстов, связанной с лексикоморфологической сложностью русского языка и самой спецификой функционирования автоматических метрик на базе n-грамм. Ключевые слова: автоматическое реферирование; информационно-коммуникационные технологии; научный дискурс; n-граммы; автоматические метрики; BLEU; ROUGE.
Описание: Vasilevskaya V. This article analyzes the applicability of n-gram-based metrics (BLEU and ROUGE) for evaluating automatically generated summaries of Russian-language scientific papers in the field of Information and Communication Technologies (ICT). The problems associated with the specifics of the metrics' functioning, concerning the Russian language and Russian-language scientific texts, in particular, texts from the field of ICT, are identified. The study concludes that the quality assessment of Russian-language scientific summaries of ICT texts, as provided by these metrics, lacks sufficient reliability. This limitation stems from the lexico-morphological complexity of the Russian language and the inherent constraints of n-gram-based automatic evaluation metrics. Key words: automatic summarization; information and communication technologies; scientific discourse; n-grams; automatic metrics; BLEU; ROUGE.
URI: http://e-lib.bsufl.by/handle/edoc/17805
ISBN: 978-985-28-0275-8
Располагается в коллекциях:Язык в эпоху цифровых трансформаций и развития искусственного интеллекта (статьи)

Файлы этого ресурса:
Файл Описание РазмерФормат 
162-169.pdf8,55 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.