1.LLM基础概念什么是LLM大型语言模型Large Language Model简单来说LLM 是一个海量文本训练出来的神经网络它能理解和生成人类语言。核心特性上下文理解能理解对话历史和上下文文本生成根据输入生成连贯的文本多任务能力问答、翻译、摘要、代码生成等主流LLM模型DeepSeek、GPT-4、GPT-3.5、文心一言、Qwen注意在以前用AI的时候有个误区把他们当做搜索引擎了其实他们可能不会查到实时信息联网搜索才行所以最合适llm模型处理的任务有概念解释知识总结写代码写文章逻辑推理分析等。2.实例运行一个基本代码调用大模型实际感知到问答的效果from openai import OpenAI import os from dotenv import load_dotenv # 读取环境变量 load_dotenv() # 初始化DeepSeek客户端 client OpenAI( api_keyos.getenv(DEEPSEEK_API_KEY), base_urlhttps://api.deepseek.com # DeepSeek的API地址 ) # 第一次调用 response client.chat.completions.create( modeldeepseek-chat, # 或 deepseek-reasoner messages[ {role: system, content: 你是一个AI导师正在教学生LLM基础知识}, {role: user, content: 用一句话解释什么是大语言模型} ], temperature0.7, # 中等创造性 max_tokens100 # 限制回答长度 ) print(response.choices[0].message.content)load_dotenv()是读取环境变量的你需要在相对应的python工作区域去找所以去创建一个.env文件文件里面声明的是API-KEYDEEPSEEK_API_KEYsk-*************************在你的工作区域然后执行代码得到的结果如下到已经迈出去一大步了可喜可贺。3.Prompt工程3.1 什么是Prompt工程最简单的理解就是提示词工程向AI输入指令也让AI更好的理解你的需求并做出最好的反馈就比如下面一个简单提示词帮我写一篇发言稿具体的提示词帮我写一篇关于环境破坏及治理的发言稿陈述环境破坏对我们的影响两种问法得到的是不同的内容下面就在我们已经实现的例子中实践3.2 修改提示词代码中提示词是两个system prompt设定AI的角色、身份、行为准则。它会影响AI的回答风格和立场。user prompt用户的具体问题或指令。1我们修改下system prompt顺便把提问的封装成一个方法代码如下def ask_llm(system_prompt, user_prompt): response client.chat.completions.create( modeldeepseek-chat, messages[ {role: system, content: system_prompt}, {role: user, content: user_prompt} ] ) return response.choices[0].message.content system_prompts [ 你是一个严谨的计算机科学家用专业术语回答问题。, 你是一个小学老师用简单的比喻解释概念。, 你是一个幽默的段子手回答要搞笑有趣。 ] user_q 什么是大语言模型 for sp in system_prompts: print(f\n【System】{sp}) print(f【回答】{ask_llm(sp, user_q)}) print(- * 50)直接运行结果如下我们可以清楚的看到不同提示大模型给出的结果不同的2修改user prompt如果在原有代码改用户提示词就会出现排列组合我们这里写一个例子以供参考bad_prompts [ 讲一下Python, # 太宽泛 给我写个代码, # 模糊 排序算法有哪些 # 缺少上下文 ] good_prompts [ 用一句话向初学者解释为什么Python适合数据分析。, 用Python写一个快速排序函数要求包含注释并举例说明如何使用。, 请列出三种常用的排序算法对比它们的时间复杂度并用表格形式展示。 ] print( 模糊提问 ) for p in bad_prompts: print(f\n【问】{p}) print(f【答】{ask_llm(你是一个编程助手, p)[:150]}...) print(\n 清晰提问 ) for p in good_prompts: print(f\n【问】{p}) print(f【答】{ask_llm(你是一个编程助手, p)[:150]}...)从上面不难看出来清晰的提示词能得到更精准、更有用的回答。3.3 Few-shot 和 Chain-of-Thought翻译为少样本学习 思维链