ОБ ИСПОЛЬЗОВАНИИ МЕТОДА КЕЙС-СТАДИ ДЛЯ СОЗДАНИЯ УНИВЕРСАЛЬНЫХ РЕСУРСОВ КОНЦЕПТУАЛЬНОГО АННОТИРОВАНИЯ МНОГОЯЗЫЧНЫХ ТЕКСТОВ

Authors

  • Светлана Олеговна Шереметьева Author
  • Ольга Ивановна Бабина Author
  • Анастсия Юрьевна Зиновьева Author
  • Екатерина Дмитриевна Неручаева Author

Abstract

Создание аннотированных корпусов текстов имеет критически важное значение для разра-ботки компьютерных технологий обработки неструктурированной информации (автоматической классификации, интеллектуального контент- и тренд-анализов, машинного обучения, машинного перевода и др.) и находится в центре внимания международных теоретических и прикладных лингвистических исследований. При этом ключевым аспектом этих исследований является авто-матизация аннотационных процедур, что, в свою очередь, требует статических (лингвистиче-ских) и динамических (программных) ресурсов, с возможностью их полного или частичного многократного применения для аннотирования многоязычных текстов различных предметных областей. В настоящей статье представлен опыт применения метода кейс-стади для создания ре-сурсов автоматизации концептуального аннотирования, одного из самых востребованных и про-блематичных видов аннотаций. Под концептуальной аннотацией понимается тип семантической аннотации, ориентированный на решение конкретных информационных задач в рамках опреде-ленной предметной области. Методология и конкретные результаты исследования представлены на основе кейс-стади корпусов текстов предметной области «Терроризм» на русском, англий-ском и французском языках. Ресурсы, созданные в ходе исследования, включают в себя как ме-тодику их разработки, так и конкретный программный инструментарий и лингвистический мате-риал (многоязычную онтологию и концептуально аннотированные корпусы текстов предметной области «Терроризм» на трех языках). Результаты исследования можно напрямую использовать для увеличения объема концептуально аннотированных корпусов предметной области «Терро-ризм», разработки метрик разрешения концептуальной многозначности, а также для автоматиза-ции аннотирования текстов других предметных областей и языков. Результаты настоящего ис-следования представляют интерес и для сравнительных лингвистических исследований.

Author Biographies

  • Светлана Олеговна Шереметьева
    доктор филологических наук, доцент, профессор кафедры лин-гвистики и перевода, Южно-Уральский государственный университет (Челябинск), sheremetevaso@susu.ru
  • Ольга Ивановна Бабина
    кандидат филологических наук, доцент, доцент кафедры лингвистики и пе-ревода, Южно-Уральский государственный университет (Челябинск), babinaoi@susu.ru
  • Анастсия Юрьевна Зиновьева
    аспирант кафедры лингвистики и перевода, Южно-Уральский госу-дарственный университет (Челябинск), bihcwd@bk.ru
  • Екатерина Дмитриевна Неручаева
    лаборант НОЦ «Лингво-инновационные технологии» института лингвистики и международных коммуникаций, Южно-Уральский государственный университет (Челябинск), neruchevaekaterina@mail.ru

Published

2021-02-15

Issue

Section

Articles