IT/TroubleShooting

Tensorflow GPU kerner died 문제, kernel process died ExitCode: 3221226505

Millennials 2022. 8. 3. 17:17

tensorflow 학습을 GPU로 돌리려고 하니 VSCode 커널이 계속 죽는 문제가 발생하였다.

error 16:56:55.300: Disposing session as kernel process died ExitCode: 3221226505, Reason: c:\\Users\\y0010\\anaconda3\\envs\\CV2\\lib\\site-packages\\traitlets\\traitlets.py:2392: FutureWarning: Supporting extra quotes around strings is deprecated in traitlets 5.0. You can use 'hmac-sha256' instead of '"hmac-sha256"' if you require traitlets >=5.  
  warn(  
c:\\Users\\y0010\\anaconda3\\envs\\CV2\\lib\\site-packages\\traitlets\\traitlets.py:2346: FutureWarning: Supporting extra quotes around Bytes is deprecated in traitlets 5.0. Use '5b3a69ad-bb15-4fcf-9417-58c368705aae' instead of 'b"5b3a69ad-bb15-4fcf-9417-58c368705aae"'

이 문제를 해결하기 위해 stackoverflow에 비슷한 사례들을 계속 서칭하였고,

https://stackoverflow.com/questions/69879188/could-not-load-library-cudnn-cnn-infer64-8-dll-error-code-126

몇번의 삽질을 반복하고 위의 답변을 따라했더니 해결이 되었다.

본인의 컴퓨터는 CUDA 11.5 version 이었고, 이에 맞는 cuDNN 8.4.1을 설치하였는데 이게 문제였다.
이 문제는 CUDA 11.5 version에 cuDNN 8.3.0 이상의 버전을 설치할 경우 발생하는 것이었고
Cuda version: 11.4 에 맞는 cuDNN version: 8.2.4 를 설치하니 문제가 해결되었다.

어이가 없는 트러블 슈팅이었다.

..................

tensorflow에서 문제를 해결했더니 이게 pytorch에서 문제가 생겼다.
cuDNN 버전을 건드렸더니 pytorch에서 GPU를 인식하지 못하는 문제가 발생.

반응형