New Features of Parallel Implementation of N-Body Problems on GPU
Аннотация
Рассмотрены особенности параллельной реализации прямого гравитационного моделирования N-тел на нескольких GPU с использованием технологии GPU-Direct. Подробно описан параллельный алгоритм решения задачи N-тел, основанный на гибридной технологии распараллеливания OpenMP-CUDA с количеством частиц Nsim 10^5div 10^7. Исследована эффективность распараллеливания нашего алгоритма для различных GPU линейки Nvidia Tesla (K20, K40, K80) при моделировании динамики гравитационно-неустойчивого звездного галактического диска. Изучена производительность и точность моделирования при использовании чисел одинарной и двойной точности. Так, например, для процессора Nvidia Tesla K80 время вычислений с двойной точностью оказалась всего лишь в 1,85 раз больше чем для одинарной точности. Показано, что использовать числа с одинарной точностью при моделировании на GPU сильно несимметричных систем взаимодействующих N-тел схемами второго порядка точности по времени некорректно, так как это приводит к значительным количественным и качественным искажениям результата. Так, например, для чисел одинарной точности после 10^4 шагов по времени полные энергия, импульс и момент импульса системы N-тел (N=2^{20}) сохранились с точностью менее 2 cdot 10^{-3}, 4cdot 10^{-2} и 7cdot 10^{-3}, соответственно. Для чисел двойной точности эти законы сохранения выполнялись с точностью более 5cdot 10^{-5}, 10^{-15} и 10^{-13}, соответственно. Наши оценки показывают, что по шкале производительность-точность использование схем второго порядка точности по времени наряду с числами двойной точности оказывается на 20-30Опубликован
2018-04-04
Выпуск
Раздел
Программирование