apt install nvidia-driverですんなりインストールできたと思ったら、しばらくPCを使っているとnvidiaのデバイスがロストしてしまう問題が発生。
使っているnvidiaグラフィックボードはMX150というノートPC用のもの。ASUS UX430UはMX150とintel UHD620を切り替えて使っている。
nvidia-smi等のコマンドを実行すると以下のメッセージが表示されてしまう。
Unable to determine the device handle for GPU 0000:01:00.0: GPU is lost. Reboot the system to recover this GPU
primus: fatal: Bumblebee daemon reported: error: Could not enable discrete graphics card
ちょっとググってみると電源系問題で起こる問題らしい。自作PCでは十分あり得るが、ノートPCで電源系の問題はちょっと考えにくい。
一生懸命ググっていたら、同じ問題の人を発見したのでメモ。
https://bbs.archlinux.org/viewtopic.php?id=218757
結論から言うとTLPの問題だった。TLPの設定ファイルからGPUとドライバをブラックリスト入りしてTLPの管理外にすれば良い。
具体的には/etc/default/tlpに次の2行を追加する。
RUNTIME_PM_BLACKLIST="01:00.0"
RUNTIME_PM_DRIVER_BLACKLIST="nouveau nvidia"
※"01:00.0"の部分はlspciでnvidiaグラフィックボードのバスのidを入れること。
■追記 2020/12/09
やっぱり同じ現象が再発しました。
ただ上記設定前後で30秒くらいでデバイスロストしていたのが、10分くらい持つようになったのでやはり電源管理になにか問題があるのではないかと疑い中。