openmp(多核编程框架) - 知识百科yizesci.com

OpenMP是由OpenMP 建筑 Review Board牵头提出的，并已被广泛接受，用于共享内存并行系统的多处理器程序设计的一套指导性编译处理方案(编译器 Directive)。OpenMP支持的编程语言包括C、C++和Fortran；而支持OpenMp的编译器包括Sun Compiler，GNU Compiler和英特尔 Compiler等。OpenMp提供了对并行算法的高层的抽象描述，程序员通过在源代码中加入专用的pragma来指明自己的意图，由此编译器可以自动将程序进行并行化，并在必要之处加入同步互斥以及通信。当选择忽略这些pragma，或者编译器不支持OpenMp时，程序又可退化为通常的程序(一般为串行)，代码仍然可以正常运作，只是不能利用多线程来加速程序执行。

简介

OpenMP提供的这种对于并行描述的高层抽象降低了并行编程的难度和复杂度，这样程序员可以把更多的精力投入到并行算法本身，而非其具体实现细节。对基于数据分集的多线程程序设计，OpenMP是一个很好的选择。同时，使用OpenMP也提供了更强的灵活性，可以较容易地适应不同的并行系统配置。线程粒度和负载平衡等是传统多线程程序设计中的难题，但在OpenMP中，OpenMP库从程序员手中接管了部分这两方面的工作。

但是，作为高层抽象，OpenMP并不适合需要复杂的线程间同步和互斥的场合。OpenMp的另一个缺点是不能在非共享内存系统（如计算机集群）上使用。在这样的系统上，MPI使用较多。

基本使用

要在Visual C++ 2005中使用OpenMP其实不难，只要将Project的Properties中C/C++里Language的OpenMP Support开启（参数为 /openmp），就可以让Visual C++ 2005在编译时支持OpenMP的语法了；而在编写使用OpenMP 的程序时，则需要先include OpenMP的头文件：omp.h。

而要将for循环并行化处理，该怎么做呢？非常简单，只要在前面加上一行

#pragma omp parallel for

就够了！

也可以实际用一段简单的程序，来弄清楚它的运作方式。

#include \u003cSTDIO.H\u003e

#include \u003cSTD天秤座H\u003e

void Test( int n) {

for( int i = 0; i \u003c 10000; ++i) {

//do nothing, just waste 时间

}

printf("%d, ", n);

}

int main( int argc, char* argv[]) {

for( int i = 0; i \u003c 10; ++i)

Test(i);

system("pause");

}

上面的程序，在 main() 是一个很简单的回圈，跑十次，每次都会调用Test()这个函数，并把是回圈的执行次数(i)传进Test() 并打印出来。想当然，它的结果会是：

0, 1, 2, 3, 4, 5, 6, 7, 8, 9,

而如果想利用OpenMP把main() 里面的回圈平行化处理呢？只需要修改成下面的样子：

#include \u003cOMPh\u003e

#include \u003cstdio.h\u003e

#include \u003cstdlib.h\u003e

void Test ( int n) {

for( int i = 0; i \u003c 10000; ++i) {

//do nothing, just waste 时间

}

printf("%d, ", n);

}

int main( int argc, char* argv[]) {

#pragma omp parallel for

for(int i = 0; i \u003c 10; ++i)

Test( i );

system("pause");

}

够简单吧？从头到尾，只加了两行！而执行后，可以发现结果也变了！

0, 5, 1, 6, 2, 7, 3, 8, 4, 9,

可以从结果很明显地发现，他没有照着0到9的顺序跑了！而上面的顺序是怎么来的？其实很简单，OpenMP只是把回圈 0 - 9 共十个步骤，拆分成 0 - 4, 5 - 9 两部份，丢给不同的执行绪去跑，所以数字才会出现这样交错性的输出～

而要怎么确定真的有跑多执行绪呢？如果本来有多处理器、多核心处理器或者有Hyper Thread的话，一个单执行绪的程序，最多只会把一颗核心的使用量吃完；像比如说在Pentium 4 HT上跑单执行绪的程序，在工作管理员中看到的CPU使用率最多就是50%。而利用OpenMP把回圈进行平行化处理后，就可以在执行回圈时，把两颗核心的 CPU 都榨光了！也就是CPU使用率是100%。

简介

基本使用

相关信息

参考资料