Параллельное решение систем линейных уравнений на гибридной архитектуре CPU+GPU

Авторы

  • Никита Сергеевич Недожогин Автор
  • Сергей Петрович Копысов Автор
  • Александр Константинович Новиков Автор

Аннотация

В статье рассматривается параллельная реализация решения систем линейных алгебраических уравнений на вычислительных узлах, содержащих центральный процессор (CPU) и графические ускорители (GPU). Производительность параллельных алгоритмов для классических схем метода сопряженных градиентов при совместном использовании CPU и GPU существенно ограничивается наличием точек синхронизации. В статье исследуется конвейерный вариант метода сопряженных градиентов с одной точкой синхронизации и возможностью распределения нагрузки между CPU и GPU при решении систем уравнений большой размерности. Численные эксперименты проведены на тестовых матрицах и вычислительных узлах разной производительности гетерогенного кластера, что позволило оценить вклад коммуникационных затрат. Алгоритмы реализованы при совместном использованием технологий MPI, OpenMP и CUDA. Предложенные алгоритмы, помимо сокращения времени выполнения, позволяют решать системы линейных уравнений и большего порядка, для которых не обеспечиваются необходимые ресурсы памяти одним GPU или вычислительным узлом. При этом, конвейерный блочный алгоритм сокращает общее время выполнения за счет уменьшения точек синхронизации и объединения коммуникаций в одно сообщение.

Биография автора

  • Никита Сергеевич Недожогин
    ст. преподаватель, кафедра вычислительной механики Института Математики Информационных Технологий и Физики Удмуртского Государственного Университета.

Опубликован

2020-06-20

Выпуск

Раздел

Вычислительная математика