Сравнительно-сопоставительный анализ лингвистических ресурсов для проведения корпусного анализа текстов
DOI:
https://doi.org/10.34680/VERBA-2024-3(13)-24-35Ключевые слова:
корпусная лингвистика, лингвистические корпуса, корпусный менеджер, стилистический анализ текстаАннотация
В статье рассматривается основная задача корпусной лингвистики – корпусный анализ письменных текстов на естественном языке с помощью лингвистических ресурсов, которые используются для её решения. Корпусный анализ подразумевает метод исследования языка, который использует большие коллекции текстов или корпуса для получения статистических и лингвистических данных о языке. Лингвистические ресурсы, такие как словари, тезаурусы, грамматические базы данных значительно расширяют возможности и точность корпусного анализа. Помимо этого, корпусная лингвистика занимается созданием корпусных менеджеров, которые обрабатывают тексты и выполняют функции составления конкорданса, поиска ключевых слов, коллокаций и другие. В работе кратко описывается функционал программ WMatrix, WordSmith, GATE, AntConc и Sketch Engine, а также проводится сравнительно-сопоставительный анализ их характеристик. В результате сделан вывод о том, что ряд программ отличается набором функций, параметрами сохранения данных, форматом входного текста и доступностью. Кроме того, перечисляются направления их использования в научно-практической деятельности. Лингвистические ресурсы могут быть полезны для стилистического анализа текстов, изучения лингвистических особенностей авторского стиля, обучения иностранному языку, например, грамматике или лексике, в компьютерной лексикографии, дискурс-анализе и в других направлениях. Рассмотренные инструменты не только повышают точность анализа, но и расширяют возможности, интегрируясь в программные инструменты для автоматизации корпусного анализа. Выбор подходящего инструмента для проведения исследования зависит от объёма и глубины анализа текста.
Скачивания
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2025 Verba

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.