Проблемы формирования обучающей выборки в задачах машинного обучения

Авторы

  • Игорь Леопольдович Кафтанников Автор
  • Андрей Викторович Парасич Автор

Аннотация

Правильное формирование обучающей выборки часто имеет решающее значение в задачах машинного обучения, что признаётся большинством специалистов в данной области. Зачастую решение задач машинного обучения сводится к грамотному формированию обучающей выборки. Несмотря на это, в современной литературе по машинному обучению вопросам формирования обучающей выборки почти не уделяется внимание, теоретическая база практически отсутствует. В настоящей статье постараемся исправить данный недостаток. В статье исследуются возможные проблемы и ошибки при формировании обучающей выборки, обобщается опыт авторов в решении задач машинного обучения, предлагаются теоретические модели для описания явлений, связанных с формированием множества обучающих данных, приводятся методы улучшения обучающей выборки. Даются практические рекомендации на основе разработанных теоретических моделей. В конце статьи представлены результаты экспериментов, демонстрирующие некоторые из проблем формирования обучающей выборки и методы их решения на примере задачи обучения деревьев решений.

Биографии авторов

  • Игорь Леопольдович Кафтанников

    канд. техн. наук, доцент кафедры электронных вычислительных машин

  • Андрей Викторович Парасич

    аспирант кафедры электронных вычислительных машин

Опубликован

2016-09-09

Выпуск

Раздел

Информатика и вычислительная техника