МОДЕЛИРОВАНИЕ МНОГОЯЗЫЧНОГО ИНТЕЛЛЕКТУАЛЬНОГО КОНТЕНТ-АНАЛИЗА
Abstract
В настоящей статье представлен опыт разработки модели интеллектуального контент-анализа – необходимого ресурса компьютерных технологий обработки неструктурированной ин-формации. Отличительной чертой модели является возможность ее применения для анализа тек-стов на различных национальных языках и механизм извлечения соответствующего задаче анализа контента, не представленного эксплицитно на поверхностном уровне текста. Модель состоит из двух основных компонентов: базы знаний, включающей ориентированную на предметную область многоязычную онтологию, онтолексиконы, динамические фреймы, а также правила обработки тек-стов и представления результатов контент-анализа. Методология разработки многоязычной модели и собственно процедуры контент-анализа описаны на примере их применения к корпусу новостных сообщений предметной области «Терроризм» на английском языке.Published
2022-02-24
Issue
Section
Articles