忻州师范学院论坛,非常可乐官网,央视元旦晚会节目单
本文实例讲述了python基于pycuda实现gpu加速并行计算功能。分享给大家供大家参考,具体如下:
nvidia的cuda 架构为我们提供了一种便捷的方式来直接操纵gpu 并进行编程,但是基于 c语言的cuda实现较为复杂,开发周期较长。而python 作为一门广泛使用的语言,具有 简单易学、语法简单、开发迅速等优点。作为第四种cuda支持语言,相信python一定会 在高性能计算上有杰出的贡献–pycuda。
具体的调用流程如下:
import pycuda.autoinit import pycuda.driver as drv import numpy from pycuda.compiler import sourcemodule mod = sourcemodule(""" __global__ void multiply_them(float *dest, float *a, float *b) { const int i = threadidx.x; dest[i] = a[i] * b[i]; } """) multiply_them = mod.get_function("multiply_them") a = numpy.random.randn(400).astype(numpy.float32) b = numpy.random.randn(400).astype(numpy.float32) dest = numpy.zeros_like(a) multiply_them( drv.out(dest), drv.in(a), drv.in(b), block=(400,1,1), grid=(1,1)) print dest-a*b #tips: copy from hello_gpu.py in the package.
补充内容:
对于gpu 加速python还有功能包,例如处理图像的pythongpu加速包——
以及专门的gpu 加速python机器学习包——
matlab对应的工具包并行和gpu计算技术
以及和
更多关于python相关内容感兴趣的读者可查看本站专题:《python数学运算技巧总结》、《python数据结构与算法教程》、《python函数使用技巧总结》、《python字符串操作技巧汇总》、《python入门与进阶经典教程》及《python文件与目录操作技巧汇总》
希望本文所述对大家python程序设计有所帮助。
如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复
python求numpy中array按列非零元素的平均值案例
网友评论