О восстановлении программ из контрольных точек

Авторы

  • Артем Юрьевич Поляков Автор

Аннотация

В работе описаны два подхода к проблеме восстановления распределенных программ из контрольных точек. Предложен алгоритм восстановления взаимосвязей типа <<родитель-потомок>> и алгоритм принадлежности к группам и сеансам для набора процессов в рамках элементарной машины распределенной вычислительной системы. Предложен алгоритм координированного восстановления набора связанных процессов, перезапускаемых раздельно (на различных элементарных машинах или терминалах). Описанные подходы реализованы в системе создания контрольных точек extitDMTCP ( extitDistributed MultiThreaded CheckPointing).

Биография автора

  • Артем Юрьевич Поляков
    лаборатория вычислительных систем

Выпуск

Раздел

Математическое моделирование