やってみよう!

プログラミングとかでぃーぷらーにんぐとかVRとか気になったものをやってみる予定

GPU環境をdocker buildしようとしたらnvidia-container-runtimeエラーが出た話

ディープラーニング環境のDockerを起動させようとしたらnvidia-container-runtimeエラーが出たので今後のためにメモ。

エラーメッセージ

ERROR: Service 'python' failed to build: OCI runtime create failed: unable to retrieve OCI runtime error (open /run/containerd/io.containerd.runtime.v1.linux/moby/a3080600b60546cd2f24d0438dd28cf0d02218efd9157453cf4c90897e049e30/log.json: no such file or directory): exec: "nvidia-container-runtime": executable file not found in $PATH: unknown

DockerfileでENV コマンドは通るけど RUNコマンドが通らない様子。

解決方法

nvidia-dockerが消えていたので下記リンクのQuickstartを実行してnvidia-dockerを入れ直したら解決した。

github.com

原因

ubuntuアップデートの通知が来ていたので、アップデートした後、要らないパッケージをsudo apt autoremoveで消そうとしたらnvidia-dockerが消えたっぽい。

確認、ダイジ。

sudo apt autoremove
Reading package lists... Done
Building dependency tree       
Reading state information... Done
The following packages will be REMOVED:
  libnvidia-container-tools libnvidia-container1 linux-headers-4.15.0-34 linux-headers-4.15.0-34-generic linux-image-4.15.0-34-generic
  linux-modules-4.15.0-34-generic linux-modules-extra-4.15.0-34-generic nvidia-container-runtime nvidia-container-runtime-hook
0 upgraded, 0 newly installed, 9 to remove and 0 not upgraded.
After this operation, 345 MB disk space will be freed.
Do you want to continue? [Y/n] y