rtx3000번대가 출시된 이후 연이은 물량 부족에 시달리는 중이라고 합니다. 엄청난 성능 증가로 인해 다들 3000번대로 넘어오고 계실텐데요, 저도 이번에 RTX3090 을 얻게 되었습니다.
바쁜 일정에 계속 미루고 미루다 이제서야 GPU 셋팅을 하게 되었는데, 처음 3000번대가 나왔을 때는 tensorflow 와의 호환 문제가 있었다고 들었으나, 이제는 해소되었다고 해서 설치를 하게 되었습니다. 제가 설치한 과정을 자세하게 알려드리겠습니다.
1. 파이썬 아나콘다 설치
아나콘다는 가상환경을 만드는데 가장 많이 사용하는 프로그램으로, 저도 여기서 아나콘다로 가상환경을 만들도록 하겠습니다.
아나콘다 설치법은 제 블로그에도 포스팅 되어있으므로 아래 게시글을 참조해주세요
stat-cbc.tistory.com/7?category=892410
2. 아나콘다를 활용한 가상환경 생성
윈도우 검색에 anaconda prompt 를 검색하시면
이렇게 프로그램이 뜨는데 이를 실행해 주시면 됩니다.
창이 뜨면 가상환경을 생성합니다.
conda create -n gpu3090 python=3.8
gpu3090은 제가 임의로 설정한 가상환경 이름으로, 다른 이름을 사용하셔도 됩니다.
엔터 치시면 가상환경이 생성되고, 잘 생성되었는지 확인하려면
conda env list
를 실행해주시면 컴퓨터에 있는 가상 환경이 모두 출력됩니다. 위에서 만든 gpu3090 이 출력되었으므로 잘 생성된 것입니다.
그러면 이 가상환경을 활성화해서 여기에 설치를 해보겠습니다.
conda activate gpu3090
이렇게 코드를 실행하면 gpu3090 이라는 가상환경 이름으로 왼쪽 () 안이 바뀐것을 확인할 수 있습니다.
3. tensorflow, pytorch 패키지 설치
이제 가상환경이 활성화되었으니 다양한 패키지를 설치해야 합니다.
1) tensorflow
텐서플로우에서 3000번대 출시 이후
pypi.org/project/tf-nightly-gpu/#history
하루에 거의 한 번씩 업데이트를 하고 있는 걸 볼 수 있습니다.
pip install tf-nightly==2.5.0.dev20201212
저는 20201212 버전을 깔았더니 잘 설치가 되었습니다.
2) pytorch
conda install pytorch
저는 이미 설치가 되어서 already installed 라고 뜹니다.
3) 기타 패키지 : jupyter notebook, scikit-learn, matplotlib, pandas, numpy
이렇게 한 줄로 설치할 패키지를 모두 입력하면 한 번에 설치가 됩니다.
conda install jupyter scikit-learn matplotlib pandas numpy
코드를 입력하면
설치가 되는데 중간에 y/n 을 물으면 무조건 y로 입력을 해주셔야 올바르게 설치가 됩니다.
4. CUDA v11 from NVIDIA 다운로드
nvidia 홈페이지에 들어가면 cuda-toolkit 을 다운받을 수 있습니다.
developer.nvidia.com/cuda-toolkit-archive
이 글을 작성하는 2020.12.21 현재 가장 최신 버전은 11.2.0 으로 되어있지만, 저희는 cudnn 이라는 추가 프로그램과 버전을 맞춰야 하기 때문에 CUDA Toolkit 11.0 Update1 (Aug 2020) 버전을 설치하도록 하겠습니다.
초록 글씨 앞부분을 누르시면 설치 링크가 뜹니다.
저희는 windows10에서 설치하므로 이렇게 선택해주시고 Download를 눌러주시면 됩니다. 2.8 기가라서 시간이 좀 걸립니다.
다운받은 프로그램을 실행해보면
설치할 경로 설정하고(특별히 없으시면 그대로 하시면 됩니다) ok를 누릅니다.
그리고 빠른 설치를 하셔도 됩니다.
5. Microsoft Visual Studio
추가로 Microsoft Visual Studio를 다운받으셔야 합니다.
visualstudio.microsoft.com/ko/downloads/
에서 Visual Studio Community Edition 버전을 다운받으시면 무료입니다.
설치시에 유의할 부분이 있는데, "C++ 를 사용한 데스크탑 개발" 를 추가해서 설치해야 합니다.
6. cuDNN 11.0
이제 cuDNN 을 설치하기 위해 해당 페이지로 접속합니다. 로그인을 해야 하기 때문에 가입을 하셔야 하는데, 구글 계정만 있으시면 가입이 쉽습니다.
developer.nvidia.com/rdp/cudnn-archive
로그인 하시면 이렇게 버전을 확인하실 수 있는데, 위에서 cuda 를 11.0 으로 설치했으므로 cuDNN 도 Download cuDNN v8.0.4 (September 28th, 2020), for CUDA 11.0 버전을 다운받았습니다.
버튼을 누르면 linux, windows 등 다양한 버전이 있습니다.
windows 다운 버튼을 누릅니다. 파일은 약 700MB 입니다.
7. Path 설정
위에서 cuda 의 설치 경로를 기본으로 하셨으면, C 드라이브의 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0 경로에 "bin", "include", "lib"의 세 폴더가 표시됩니다. 이를 확인하신 후 제어판> 시스템 및 보안> 시스템 > 고급 시스템 설정
으로 들어가시면 환경변수를 설정할 수 있습니다. 고급 탭으로 가시면 환경 변수가 나오는데 밑에 시스템 변수 란에서 Path 라는 부분을 찾습니다. 두 번 클릭하시면 path 리스트들이 뜹니다.
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\libnvvp
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\extras\CUPTI\lib64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\include
이렇게 path 4개를 각각 새로만들기에 추가합니다.
8. 시스템 재부팅
설치한 후에는 전원을 다시 껐다가 킵니다.
9. tensorflow 설치 확인
가상환경에서 jupyter 노트북을 실행합니다.
import tensorflow as tf
tf.config.list_physical_devices()
주피터에서 해당 코드를 한 줄씩 실행합니다.
tensorflow 패키지는 잘 실행이 됩니다.
gpu 가 잘 설치되서 출력되는 것을 확인할 수 있습니다.
잘 설치가 안됐으면 cpu 만 출력됩니다.
+ 오류 해결
저도 한 번에 실행이 잘 안되고, 오류가 났었습니다.
이럴 때는 주피터 노트북의 실행 log 를 보면 됩니다. 여기서 could not load dynamic library 'cusparse64_10.dll' ,... 과 같은 오류를 확인하시면 됩니다. 저는 cudart64_101.dll 를 찾을 수 없다는 오류가 먼저 떴었습니다. cudart64_110.dll 파일을 복사해서 복사본의 이름을 cudart64_101.dll으로 바꾸니 해결되었습니다. 위에서부터오류를하나씩해결해보시면될것같습니다.
저는 cusolver64_11.dll > cusolver64_10.dll , cudart64_110.dll > cudart64_101.dll 두 개 수정하니까 잘 작동했습니다.
참조
stevejeffersonr.medium.com/setting-up-your-nvidia-gpu-for-deep-learning-2020-22c153d4200b
www.reddit.com/r/tensorflow/comments/jsalkw/rtx_3090_and_tensorflow_for_windows_10_step_by/
'데이터과학 > 데이터분석' 카테고리의 다른 글
[Python] H2O 패키지를 활용하여 XGBoost 모델 구축하기 (0) | 2022.08.31 |
---|---|
Github 깃허브 Windows10 설치 및 사용법 (2) | 2020.12.09 |
인지진단모형(Cognitive Diagnostic Model) (0) | 2020.11.09 |
Comment