Ollama GPU资源占用查看:两种高效方法

2026-06-02阅读 0热度 0
GPU资源

本地大模型运行时,GPU内存监控是极易忽略却至关重要的环节。遇到显存报警或推理速度骤降,很多用户不知从何排查。分享一个实战经验——善用几个小工具,Ollama的资源占用情况便能一目了然。

? 核心要点

  • 主题聚焦:Ollama GPU内存使用率查看与实时监控方法

? 详细步骤:查看Ollama的GPU内存占用

方法1:使用 ollama ps 命令即时查询

最快捷的方式——执行 ollama ps 命令,瞬间列出当前运行的模型及资源占用详情:

# 查看当前运行的模型及其资源消耗
ollama ps

输出示例截图:

各字段含义解析:

  • NAME:模型名称与版本号
  • ID:模型唯一标识
  • SIZE:模型文件大小,即权重参数所占磁盘空间
  • PROCESSOR:共享GPU(标记为CPU)和专用GPU的当前使用百分比
  • CONTEXT:模型上下文窗口消耗的内存容量
  • UNTIL:模型已运行的持续时间

实时监控技巧:

# 持续监控,每2秒刷新一次
watch -n 2 ollama ps
# Windows PowerShell 等效:每2秒执行一次
while ($true) { ollama ps; Start-Sleep 2 }

需要实时监控时,watch 命令每2秒刷新一次,模型内存的细微波动尽收眼底。

方法2:Windows任务管理器直观监控

Windows用户可借助图形界面快速定位。操作步骤:

  1. 按下 Ctrl + Shift + Esc 启动任务管理器
  2. 切换至「详细信息」标签页
  3. 定位到 ollama.exe 进程
  4. 右键单击标题行 →「选择列(S)」→ 勾选所有与「GPU」相关的列

重点关注指标:

  • GPU:进程占用的GPU使用率
  • 专用 GPU 内存:显存占用量清晰显示
  • 共享 GPU 内存:系统内存充当显存时的使用状况

笔者环境中的实际截图如下:

此外,任务管理器的「性能」页面可查看GPU整体使用情况,如下图所示:

结合这两种手段,Ollama的内存消耗状况便无处遁形。命令行适用于快速诊断与自动化脚本监控,图形界面则便于实时观察动态变化。根据场景灵活选用,排查效率将大幅提升。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策