Модификация алгоритма случайного леса для классификации нестационарных потоковых данных

Авторы

  • Алексей Витальевич Жуков Автор
  • Денис Николаевич Сидоров Автор

Аннотация

Предложен метод классификации нестационарных потоковых данных. К таким данным относятся характеристики поведения сложных систем, процессы, обладающие высокой степенью стохастичности, такие как скорость ветра. В данной работе предложена эффективная модификация алгоритма случайного леса, позволяющая повысить точность классификации состояния путем взвешивания ответов отдельных классификаторов композиции. Опираясь на метод Accuracy Weighted Ensemble (AWE), взвешивание производится в соответствии с оценкой ошибки каждого классификатора на новых данных. Такая оценка производится с использованием метода k ближайших соседей и внутренней структуры случайного леса. В качестве стратегии обновления композиции используется замена классификаторов с низкой точностью на новых данных. Приводятся результаты тестирования предложенного метода и сравнение с другими современными методами.

Биографии авторов

  • Алексей Витальевич Жуков
    аспирант кафедры "Информационные технологии"
  • Денис Николаевич Сидоров
    доктор физико-математических наук, ведущий научный сотрудник

Опубликован

2017-05-04

Выпуск

Раздел

Программирование