Драйверы NVIDIA установлены, но nvidia-smi не работает на CentOS

У меня есть сервер, который я использую для хранения и из-за нехватки места, где я живу, я держу его в другом месте. Чтобы перенести файлы в свою сеть, я использую raspberry pi, который монтирует файлы с сервера с помощью sshfs.

Недавно мне пришлось перейти на raspbian jessie из-за сбоя питания, и я понял, что sshfs становится серьезно нестабильным. Папки будут правильно смонтированы, но через какое-то время я не смогу к ним подключиться, и raspberry pi зависнет, если я захочу просмотреть содержимое монтирований.

Я пытался:

  1. использовал переподключение в fstab
  2. использовал значения ServerAliveInterval и ServerAliveCountMax в файле.ssh/config, но безрезультатно.
  3. Другие решения я читал на большинстве форумов.

но не кости! Пока я не изменил файл fstab следующим образом:

sshfs#user@server:/remote/folder /local/mount/dir fuse IdentityFile=sshkeyfile,Port=XXX,uid=1000,gid=1000,allow_other,_netdev,ServerAliveInterval=45,ServerAliveCountMax=2,reconnect,noatime,auto 0 0

И это работает! Больше никаких отключений!Похоже, что sshfs по какой-то причине не читает файл конфигурации ssh, и сигналы проверки активности никогда не отправлялись.

1
18.02.2018, 08:41
2 ответа

Я запускаю кластер высокопроизводительных вычислений на работе, и у нас установлен RPM-драйвер cuda -. Он предоставляет nvidia -smi, но он находится в каталоге $INSTALL _ROOT/libs/440.64.00/bin. $INSTALL _ROOT может варьироваться от системы к системе, поэтому вам придется сначала найти его.

Когда я вспомнил, что мы использовали RPM-драйвер с именем cuda -, а не драйвер с именем nvidia, я нашел инструмент nvidia -smi, подобный этому:

об/мин -qa | grep -и куда | xargs об/мин -ql | grep -i nvidia -smi

Что дало мне три пути (вы можете увидеть мой INSTALL _ROOT здесь)

/cm/local/apps/cuda -драйвер/libs/440.64.00/bin/nvidia -smi /cm/local/apps/cuda -driver/libs/440.64.00/share/doc/NVIDIA _GLX -1.0/html/nvidia -smi.html /cm/local/apps/cuda -driver/libs/440.64.00/share/man/man1/nvidia -smi.1.gz

А затем я использовал rpm -qf на одном из них, чтобы получить имя RPM.

Надеюсь, это поможет!

1
25.02.2021, 17:22

Asked 3 years, 1 month ago

вы сказали У меня установлен драйвер NVIDIA однако вы не описали, как вы его установили. Имейте в виду, что драйвер nvidia является модулем ядра, и он часто теряется после выполнения yum updateпри обновлении ядра; модуль ядра nvidia не сохраняется (, если у вас не установлен DKMS ), поэтому функциональность nvidia прекратится.

Однако это не объясняет, почему /usr/bin/nvidia-smiговорит, что команда не найдена, что является другим вопросом, но именно здесь должно быть nvidia-smiи /usr/bin, очевидно, должно быть в вашем PATH. Простая переустановка nvidia через файл nvidia.run исправит это...

Ниже приведен мой предпочтительный метод установки NVIDIA (и cuda )под RHEL/CentOS 7.x, который хорошо служил мне (в течение последних 3 лет)

  • загрузите NVIDIA-Linux-x86_64-460.67.runс nvidia {получите правильный вариант для вашей видеокарты} около 150 МБ
  • скачать cuda_11.2.2_460.32.03_linux.runс nvidia {независимо от того, какая последняя версия, более 2 Гб}
  • suукоренить; скопируйте оба в /root; chmod 700на обоих;
  • systemctl set-default multi-user.target
  • rebootили systemctl isolate multi-user.targetилиinit 3
  • запустите /root/NVIDIA -Linux -x86 _64 -460.67.run {и просмотрите сборку модуля ядра часть}
  • после успешной установки /usr/bin/nvidia-smiдолжен присутствовать и работать;
  • , затем выполните systemctl isolate graphical.targetили init 5, и, если графическая консоль работает, войдите в систему и вернитесь к systemctl set-default graphical.target, если хотите.
  • в идеале сделать последнюю перезагрузку, чтобы убедиться, что все работает

Процесс установки CUDA в основном такой же.

Графический драйвер nvidia, входящий в состав файла cuda.run, не всегда является последним.

Последний драйвер nvidia.run будет (должен )всегда работать с любой версией cuda.

Вам не требуется устанавливать прилагаемый графический драйвер nvidia в файле cuda.run,поэтому я предпочитаю снять этот флажок при установке cuda.

2
30.03.2021, 17:18

Теги

Похожие вопросы