ОБ ИСПОЛЬЗОВАНИИ МЕТОДА КЕЙС-СТАДИ ДЛЯ СОЗДАНИЯ УНИВЕРСАЛЬНЫХ РЕСУРСОВ КОНЦЕПТУАЛЬНОГО АННОТИРОВАНИЯ МНОГОЯЗЫЧНЫХ ТЕКСТОВ
Abstract
Создание аннотированных корпусов текстов имеет критически важное значение для разра-ботки компьютерных технологий обработки неструктурированной информации (автоматической классификации, интеллектуального контент- и тренд-анализов, машинного обучения, машинного перевода и др.) и находится в центре внимания международных теоретических и прикладных лингвистических исследований. При этом ключевым аспектом этих исследований является авто-матизация аннотационных процедур, что, в свою очередь, требует статических (лингвистиче-ских) и динамических (программных) ресурсов, с возможностью их полного или частичного многократного применения для аннотирования многоязычных текстов различных предметных областей. В настоящей статье представлен опыт применения метода кейс-стади для создания ре-сурсов автоматизации концептуального аннотирования, одного из самых востребованных и про-блематичных видов аннотаций. Под концептуальной аннотацией понимается тип семантической аннотации, ориентированный на решение конкретных информационных задач в рамках опреде-ленной предметной области. Методология и конкретные результаты исследования представлены на основе кейс-стади корпусов текстов предметной области «Терроризм» на русском, англий-ском и французском языках. Ресурсы, созданные в ходе исследования, включают в себя как ме-тодику их разработки, так и конкретный программный инструментарий и лингвистический мате-риал (многоязычную онтологию и концептуально аннотированные корпусы текстов предметной области «Терроризм» на трех языках). Результаты исследования можно напрямую использовать для увеличения объема концептуально аннотированных корпусов предметной области «Терро-ризм», разработки метрик разрешения концептуальной многозначности, а также для автоматиза-ции аннотирования текстов других предметных областей и языков. Результаты настоящего ис-следования представляют интерес и для сравнительных лингвистических исследований.Published
2021-02-15
Issue
Section
Articles