目录一、Ollama基本概述以及如何下载二、如果安装Ollama三、代码调用ollama本地模型一、Ollama基本概述以及如何下载这玩意儿就是个本地大模型启动器。以前你想玩个 Llama3、Qwen 啥的得配环境、装 Python、搞依赖折腾半天最后报错“显存不足”直接劝退。现在有了 Ollama基本上就是一键下载一行命令开跑。Ollama官方网址直接点击Download下载即可。二、如果安装Ollama直接点击Install安装即可也没有什么配置环境变量配置路径什么的就一个Install安装。安装完成之后会出现ollama的聊天框你在第一次用模型的时候他是需要先下载的如果出现一下问题这是因为Ollama是国外的软件可能会受到网络波动的影响多试几次就行了。Unable to download model.Please check your internet connection to download the modelforoffline use.特别注意Ollama部署本地模型特别吃显卡你的显卡越牛跑的也就越快。三、代码调用ollama本地模型fromopenaiimportOpenAIimportos clientOpenAI(base_urlhttps://localhost:11434/v1,)messages[{role:user,content:你能干什么}]completionclient.chat.completions.create(modelqwen3:4b,# 您可以按需更换为其它深度思考模型messagesmessages,extra_body{enable_thinking:True},streamTrue)is_answeringFalse# 是否进入回复阶段print(\n*20思考过程*20)forchunkincompletion:deltachunk.choices[0].deltaifhasattr(delta,reasoning_content)anddelta.reasoning_contentisnotNone:ifnotis_answering:print(delta.reasoning_content,end,flushTrue)ifhasattr(delta,content)anddelta.content:ifnotis_answering:print(\n*20完整回复*20)is_answeringTrueprint(delta.content,end,flushTrue)