Ollama GPU资源占用查看:两种高效方法
本地大模型运行时,GPU内存监控是极易忽略却至关重要的环节。遇到显存报警或推理速度骤降,很多用户不知从何排查。分享一个实战经验——善用几个小工具,Ollama的资源占用情况便能一目了然。
? 核心要点
- 主题聚焦:Ollama GPU内存使用率查看与实时监控方法
? 详细步骤:查看Ollama的GPU内存占用
方法1:使用 ollama ps 命令即时查询
最快捷的方式——执行 ollama ps 命令,瞬间列出当前运行的模型及资源占用详情:
# 查看当前运行的模型及其资源消耗 ollama ps
输出示例截图:
各字段含义解析:
- NAME:模型名称与版本号
- ID:模型唯一标识
- SIZE:模型文件大小,即权重参数所占磁盘空间
- PROCESSOR:共享GPU(标记为CPU)和专用GPU的当前使用百分比
- CONTEXT:模型上下文窗口消耗的内存容量
- UNTIL:模型已运行的持续时间
实时监控技巧:
# 持续监控,每2秒刷新一次
watch -n 2 ollama ps
# Windows PowerShell 等效:每2秒执行一次
while ($true) { ollama ps; Start-Sleep 2 }
需要实时监控时,watch 命令每2秒刷新一次,模型内存的细微波动尽收眼底。
方法2:Windows任务管理器直观监控
Windows用户可借助图形界面快速定位。操作步骤:
- 按下
Ctrl + Shift + Esc启动任务管理器 - 切换至「详细信息」标签页
- 定位到
ollama.exe进程 - 右键单击标题行 →「选择列(S)」→ 勾选所有与「GPU」相关的列
重点关注指标:
- GPU:进程占用的GPU使用率
- 专用 GPU 内存:显存占用量清晰显示
- 共享 GPU 内存:系统内存充当显存时的使用状况
笔者环境中的实际截图如下:
此外,任务管理器的「性能」页面可查看GPU整体使用情况,如下图所示:
结合这两种手段,Ollama的内存消耗状况便无处遁形。命令行适用于快速诊断与自动化脚本监控,图形界面则便于实时观察动态变化。根据场景灵活选用,排查效率将大幅提升。


