Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://e-lib.bsufl.by/handle/edoc/17805| Название: | Оценка качества русскоязычных автоматических рефератов с применением метрик на базе n-грамм (на материале научных текстов из области ИКТ) |
| Другие названия: | Quality Evaluation Of Russian -Language Automatic Summaries With N-Gram Metrics (based on ICT Scientific Texts) |
| Авторы: | Василевская, В. М. |
| Ключевые слова: | Языкознание (лингвистика) Прикладное языкознание Перевод |
| Дата публикации: | 2025 |
| Издатель: | Белорусский государственный университет иностранных языков |
| Библиографическое описание: | Василевская, В. М. Оценка качества русскоязычных автоматических рефератов с применением метрик на базе n-грамм (на материале научных текстов из области ИКТ) / В. М. Василевская // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : сб. науч. ст. по итогам II междунар. науч. конф., Минск, 23–24 окт. 2025 г. / редкол. : Н. Е. Лаптева (отв. ред.) [и др.]. – Минск : БГУИЯ, 2025. – С. 162–169. |
| Аннотация: | В данной статье проведен анализ применимости основанных на n-граммах метрик BLEU и ROUGE для оценки автоматически сгенерированных рефератов русскоязычных научных статей в области информационно-коммуникационных технологий (ИКТ). Выделены связанные со спецификой функционирования метрик проблемы, касающиеся русского языка и русскоязычных научных текстов, в частности, текстов из области ИКТ. Сделан вывод о недостаточной достоверности предоставленной данными метриками оценки качества русскоязычных научных рефератов ИКТ-текстов, связанной с лексикоморфологической сложностью русского языка и самой спецификой функционирования автоматических метрик на базе n-грамм. Ключевые слова: автоматическое реферирование; информационно-коммуникационные технологии; научный дискурс; n-граммы; автоматические метрики; BLEU; ROUGE. |
| Описание: | Vasilevskaya V. This article analyzes the applicability of n-gram-based metrics (BLEU and ROUGE) for evaluating automatically generated summaries of Russian-language scientific papers in the field of Information and Communication Technologies (ICT). The problems associated with the specifics of the metrics' functioning, concerning the Russian language and Russian-language scientific texts, in particular, texts from the field of ICT, are identified. The study concludes that the quality assessment of Russian-language scientific summaries of ICT texts, as provided by these metrics, lacks sufficient reliability. This limitation stems from the lexico-morphological complexity of the Russian language and the inherent constraints of n-gram-based automatic evaluation metrics. Key words: automatic summarization; information and communication technologies; scientific discourse; n-grams; automatic metrics; BLEU; ROUGE. |
| URI: | http://e-lib.bsufl.by/handle/edoc/17805 |
| ISBN: | 978-985-28-0275-8 |
| Располагается в коллекциях: | Язык в эпоху цифровых трансформаций и развития искусственного интеллекта (статьи) |
Файлы этого ресурса:
| Файл | Описание | Размер | Формат | |
|---|---|---|---|---|
| 162-169.pdf | 8,55 MB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.