Я пытаюсь ускорить выполнение следующего кода с помощью OpenMP. Код предназначен для вычисления Мандельброта и вывода его на холст.

Код отлично работает в однопоточном режиме, но я хочу использовать OpenMP, чтобы сделать его быстрее. Я пробовал всевозможные комбинации частных и общих переменных, но пока ничего не работает. С OpenMP код всегда работает немного медленнее, чем без него (50 000 итераций - на 2 секунды медленнее).

Я использую Ubuntu 16.04 и компилирую с GCC.

void calculate_mandelbrot(GLubyte *canvas, GLubyte *color_buffer, uint32_t w, uint32_t h, mandelbrot_f x0, mandelbrot_f x1, mandelbrot_f y0, mandelbrot_f y1, uint32_t max_iter) {
mandelbrot_f dx = (x1 - x0) / w;
mandelbrot_f dy = (y1 - y0) / h;
uint16_t esc_time;
int i, j;
mandelbrot_f x, y;

//timer start
clock_t begin = clock();

#pragma omp parallel for private(i,j,x,y, esc_time) shared(canvas, color_buffer)
for(i = 0; i < w; ++i) {
    x = x0 + i * dx;
    for(j = 0; j < h; ++j) {
        y = y1 - j * dy;
        esc_time = escape_time(x, y, max_iter);

        canvas[ GET_R(i, j, w) ] = color_buffer[esc_time * 3];
        canvas[ GET_G(i, j, w) ] = color_buffer[esc_time * 3 + 1];
        canvas[ GET_B(i, j, w) ] = color_buffer[esc_time * 3 + 2];

      }
}

//time calculation
clock_t end = clock();
double time_spent = (double)(end - begin) / CLOCKS_PER_SEC;
printf("%f\n",time_spent );
}

Функция escape_time, которую использует код:

inline uint16_t escape_time(mandelbrot_f x0, mandelbrot_f y0, uint32_t max_iter) {
mandelbrot_f x = 0.0;
mandelbrot_f y = 0.0;
mandelbrot_f xtemp;
uint16_t iteration = 0;
while((x*x + y*y < 4) && (iteration < max_iter)) {
    xtemp = x*x - y*y + x0;
    y = 2*x*y + y0;
    x = xtemp;
    iteration++;
}
return iteration;

}

Код взят из этого репозитория https://github.com/hortont424/mandelbrot

0
martin49 26 Ноя 2016 в 00:04

2 ответа

Лучший ответ

Во-первых, как указано в комментарии, используйте omp_get_wtime() вместо clock () (он даст вам количество тактов часов, накопленных во всех потоках), измерьте время. Во-вторых, если я правильно помню, у этого алгоритма есть проблемы с балансировкой нагрузки, поэтому попробуйте использовать динамическое планирование:

//timer start
double begin = omp_get_wtime();

#pragma omg parallel for private(j,x,y, esc_time) schedule(dynamic, 1)
for(i = 0; i < w; ++i) {
    x = x0 + i * dx;
    for(j = 0; j < h; ++j) {
        y = y1 - j * dy;
        esc_time = escape_time(x, y, max_iter);

        canvas[ GET_R(i, j, w) ] = color_buffer[esc_time * 3];
        canvas[ GET_G(i, j, w) ] = color_buffer[esc_time * 3 + 1];
        canvas[ GET_B(i, j, w) ] = color_buffer[esc_time * 3 + 2];

      }
}

//time calculation
double end = omp_get_wtime();
double time_spent = (double)(end - begin) / CLOCKS_PER_SEC;
printf("%f\n",time_spent );
1
dreamcrash 13 Дек 2016 в 23:22

Как было предложено, моя проблема была вызвана использованием функции clock (), которая измеряет время процессора. Использование omp_get_wtime () вместо этого решило мою проблему.

0
martin49 19 Дек 2016 в 15:31