本文共 1446 字,大约阅读时间需要 4 分钟。
一直以来生产中的环境都是caffe + GTX1060显卡 + CUDA8 + cuDNN5,因为面临着10系越来越不好买(停产一年有余),所以需要更换20系的显卡,并选择了RTX 2060。 但是由于2060是图灵架构,只能使用CUDA10(貌似是这样)。因此需要将caffe结合CUDA10.0以及相应的cuDNN编译
这里提供CUDA10.0以及对应的cuDNN的百度网盘连接连接:https://pan.baidu.com/s/1RAsop0aNmBMfGpUe84Atuw
提取码:5nq4注意:RTX2060的驱动对win10版本有要求,需要180X以上,具体的不记得了。
我的caffe版本是带有windows文件夹的,具体的版本不太清楚。
安装CUDA10.0和CUDA8.0一样,正常安装即可,但是要注意,二者的大部分路径是共存的,但是有两个CUDA8.0路径会被CUDA10.0直接替代, CUDA_PATH, NVCUDASAMPLES_ROOT(这是我后期观察的结果,可能不正确)。如果想用回8.0,又不想重新安装,可能需要重新设置这两个环境变量。
修改CommonSettings.props
中的CudaVersion为10.0
CommonSettings.props
中的CudaArchitecture,这个参数是用来设置CUDA的计算能力的,CUDA10.0应该支持更高的计算能力,我添加了compute_70, sm_70; compute_75, sm_75
修改'include\caffe\util\cudnn.hpp
里面的setConvolutionDesc , 修改后函数如下:
templateinline void setConvolutionDesc(cudnnConvolutionDescriptor_t* conv, cudnnTensorDescriptor_t bottom, cudnnFilterDescriptor_t filter, int pad_h, int pad_w, int stride_h, int stride_w) { #if CUDNN_VERSION_MIN(6, 0, 0) CUDNN_CHECK(cudnnSetConvolution2dDescriptor(*conv, pad_h, pad_w, stride_h, stride_w, 1, 1, CUDNN_CROSS_CORRELATION, dataType ::type)); #else CUDNN_CHECK(cudnnSetConvolution2dDescriptor(*conv, pad_h, pad_w, stride_h, stride_w, 1, 1, CUDNN_CROSS_CORRELATION)); #endif}
5,. nvcc.hpp, 我的好像原本就是那样所以就不需要动了,我这里放一下截图,自己看一下参考文献[1]。
6 重新编译libcaffe,然后重新编译caffe,最后编译自己的项目(我不用python接口)参考文献[1]:https://blog.csdn.net/raby_gyl/article/details/84643160