Оценка качества русскоязычных автоматических рефератов с применением метрик на базе n-грамм (на материале научных текстов из области ИКТ)

Василевская, В. М.

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://e-lib.bsufl.by/handle/edoc/17805

Название:	Оценка качества русскоязычных автоматических рефератов с применением метрик на базе n-грамм (на материале научных текстов из области ИКТ)
Другие названия:	Quality Evaluation Of Russian -Language Automatic Summaries With N-Gram Metrics (based on ICT Scientific Texts)
Авторы:	Василевская, В. М.
Ключевые слова:	Языкознание (лингвистика) Прикладное языкознание Перевод
Дата публикации:	2025
Издатель:	Белорусский государственный университет иностранных языков
Библиографическое описание:	Василевская, В. М. Оценка качества русскоязычных автоматических рефератов с применением метрик на базе n-грамм (на материале научных текстов из области ИКТ) / В. М. Василевская // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : сб. науч. ст. по итогам II междунар. науч. конф., Минск, 23–24 окт. 2025 г. / редкол. : Н. Е. Лаптева (отв. ред.) [и др.]. – Минск : БГУИЯ, 2025. – С. 162–169.
Аннотация:	В данной статье проведен анализ применимости основанных на n-граммах метрик BLEU и ROUGE для оценки автоматически сгенерированных рефератов русскоязычных научных статей в области информационно-коммуникационных технологий (ИКТ). Выделены связанные со спецификой функционирования метрик проблемы, касающиеся русского языка и русскоязычных научных текстов, в частности, текстов из области ИКТ. Сделан вывод о недостаточной достоверности предоставленной данными метриками оценки качества русскоязычных научных рефератов ИКТ-текстов, связанной с лексикоморфологической сложностью русского языка и самой спецификой функционирования автоматических метрик на базе n-грамм. Ключевые слова: автоматическое реферирование; информационно-коммуникационные технологии; научный дискурс; n-граммы; автоматические метрики; BLEU; ROUGE.
Описание:	Vasilevskaya V. This article analyzes the applicability of n-gram-based metrics (BLEU and ROUGE) for evaluating automatically generated summaries of Russian-language scientific papers in the field of Information and Communication Technologies (ICT). The problems associated with the specifics of the metrics' functioning, concerning the Russian language and Russian-language scientific texts, in particular, texts from the field of ICT, are identified. The study concludes that the quality assessment of Russian-language scientific summaries of ICT texts, as provided by these metrics, lacks sufficient reliability. This limitation stems from the lexico-morphological complexity of the Russian language and the inherent constraints of n-gram-based automatic evaluation metrics. Key words: automatic summarization; information and communication technologies; scientific discourse; n-grams; automatic metrics; BLEU; ROUGE.
URI:	http://e-lib.bsufl.by/handle/edoc/17805
ISBN:	978-985-28-0275-8
Располагается в коллекциях:	Язык в эпоху цифровых трансформаций и развития искусственного интеллекта (статьи)

Файлы этого ресурса:

Файл	Описание	Размер	Формат
162-169.pdf		8,55 MB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий
Белорусского государственного университета иностранных языков

ISSN (online):

РепозиторийБелорусского государственного университета иностранных языков

ISSN (online):

Репозиторий
Белорусского государственного университета иностранных языков