Skip to content
Go back

AI核心概念大串联

Published:  at  6:11 PM

这个博客系统梳理了大模型领域的核心概念、技术原理与发展脉络,适合快速建立完整知识框架。

一、底层引擎:大语言模型 (LLM)

核心定义与架构

发展里程碑

时间事件意义
2017 年Transformer 架构提出奠定大模型技术基础
2022 年底GPT-3.5 发布首个达到可用级别的大模型,让 AI 对话真正普及
2023 年 3 月GPT-4 发布大幅提升 AI 能力天花板,支持多模态输入
2023 年后Claude、Gemini 等模型涌现AI 赛道从 OpenAI 独角戏变为多强竞争,推动技术快速迭代

二、数据处理单元:Token

image-20260506214445687

核心特性

Token 与自然语言单位的关系

语言单位与 Token 的关系示例
中文词语非一一对应,可能被拆分“工作坊”→“工作”+“坊”
英文单词常见词通常对应 1 个 Token“hello”→1 个 Token
复杂单词可能被拆分“helpful”→“help”+“ful”
特殊字符可能需多个 Token 表示“✅”→3 个 Token

量化参考

补充说明:Token 的切分基于BPE(字节对编码)算法,是模型自主学习的文本切分规则,能平衡语言效率和模型处理能力。


三、大模型的临时记忆体:Context

核心概念

出现的原因:大模型之前是你给它输入,它给你输出,那它是如何记住聊天的内容的呢?背后的程序会把你之前的整段的对话历史找过来一起发过去,这样就是引出了模型有了对话历史,模型每次看到的都是完整的对话内容,这就引出了Context。

主流模型 上下文窗口(Context Window) 对比

注意:一个token约等于1.5个汉字

模型Context Window(Token)约合汉字数量
GPT-4.5105 万约 157.5 万
Gemini 3.1 Pro100 万约 150 万
Claude Opus 4.6100 万约 150 万

突破 Context Window 限制的方案


四、指令交互:Prompt

Prompt Engineering 提示词工程

Prompt定义与分类

Prompt定义:
Prompt 分类:

有了他们的配合大模型既能守住规矩,又能完成你的具体的请求。


五、感知外部环境:Tool

核心作用

工作流程

image-20260507095913167

  1. 用户提问 → 平台转发(含工具列表)
  2. 大模型分析 → 生成工具调用指令
  3. 平台执行调用(真正的工具,也就是函数) → 获取结果
  4. 大模型整理结果 → 自然语言输出

角色分工

image-20260507100001665

角色职责
大模型选择工具、生成参数、归纳结果
工具执行具体功能(如查询天气、调用计算器、访问数据库)
平台转发信息、执行工具调用、处理权限与安全校验

六、工具标准化:MCP(负责把工具接进来)

补充:Function Calling(模型与外部工具交互的一种能力)

定义:Function Calling(函数调用)是大模型连接现实世界的核心接口,它让原本只能 “生成文字” 的模型,拥有了调用外部工具、执行真实操作的能力。

**底层逻辑:**先看最底层:Function Calling。模型本身没有任何执行能力,它能做的是:接收你传入的 tools 列表,看到每个工具的名字、description 和参数结构,然后在合适的时候返回一个结构化的调用请求

和 Agent、MCP 的关系

image-20260507105500940

这个图片的解释:

Function Calling:图里蓝色框标注的部分,是大模型生成工具调用指令的核心能力

MCP:图里红色框标注的部分,是工具与大模型之间的标准化通信协议,解决不同工具接入不统一的问题

Agent:把这些部分串起来的整体,也就是 “能自主调用工具完成任务的系统”


七、自主决策系统:Agent

image-20260507101253203

补充说明:Agent 是大模型从 “被动响应” 到 “主动执行” 的关键形态,也是当前 AI 应用落地的核心方向之一。


八、任务定制:Agent Skill(负责如何使用这些工具)

核心功能

# SKILL.md - 天气查询助手

## 📋 元数据层

### 名称

天气查询助手

### 描述

当用户询问天气相关问题(如城市/地区的实时天气、未来预报、温度、湿度、降水概率、穿衣建议等)时,调用此技能获取准确信息并整理成自然语言回复。

### 触发关键词

天气、气温、温度、下雨、晴天、多云、湿度、风力、穿衣建议、预报

---

## 🎯 指令层

### 任务目标

1.  理解用户的天气查询意图,提取关键信息(目标城市/地区、时间范围、具体需求)
2.  调用天气查询工具获取对应数据
3.  将工具返回的结构化数据整理成清晰、友好的自然语言回复
4.  根据天气情况,主动提供实用的生活建议(如穿衣、出行、防晒/防雨提示)

### 执行步骤

1.  **信息提取**
    - 从用户问题中提取:目标城市(如上海、北京)、时间范围(今天/明天/未来3天)、具体需求(温度/降水/风力/穿衣建议)
    - 若用户未指定城市,优先使用对话上下文或询问用户补充信息
    - 若用户未指定时间,默认查询「当天实时天气+未来24小时预报」

2.  **工具调用**
    - 调用`weather_query`工具,传入参数:
      - `city`: 提取到的城市/地区名称
      - `date`: 查询日期(格式:YYYY-MM-DD,不传默认当天)
    - 等待工具返回结构化天气数据(温度、湿度、风力、天气状况、降水概率等)

3.  **结果整理**
    - 按「实时天气 → 关键指标解读 → 实用建议」的结构组织内容
    - 温度、湿度、风力数据用加粗突出关键信息
    - 降水概率超过30%时,明确提醒带雨具
    - 温度低于10℃或高于30℃时,补充穿衣/防暑/保暖建议

4.  **回复输出**
    - 语言口语化、友好,避免生硬的参数罗列
    - 若用户问题存在歧义(如未指定城市),礼貌追问补充信息
    - 若工具调用失败,给出备用回复并说明情况

### 判断规则

- ✅ 触发条件:用户问题包含天气相关关键词,或明确询问某地区的气象情况
- ❌ 不触发条件:用户问题与天气无关(如编程、历史、数学题),直接按原问题处理
- ⚠️ 异常处理:
  - 若工具返回错误(如城市不存在、接口超时),回复:“抱歉,暂时无法查询到该地区的天气信息,你可以告诉我具体城市名称,我再帮你试试~”
  - 若用户问题模糊(如“明天天气怎么样”),回复:“你想查询哪个城市的天气呢?告诉我城市名,我马上帮你看看~”

### 输出格式示例

```text
🌤️ 上海今天天气播报
实时天气:多云
温度:22℃(体感24℃)
湿度:65% | 风力:东北风3级 | 降水概率:10%

💡 今日小贴士:
气温舒适,适合外出活动,早晚温差不大,穿长袖T恤+薄外套即可,紫外线较弱,不用特意防晒哦~
```

技术实现

image-20260507102119585

image-20260507102206551

补充特性:Agent Skill 支持运行代码、引用资源,采用渐进式披露机制,进一步优化 Token 使用效率。


九、概念体系关联

graph LR
    A[LM 核心引擎] --> B[Token 数据单位]
    B --> C[Context 记忆空间]
    C --> D[Prompt 交互接口]
    D --> E[Tool 外部能力]
    E --> F[MCP 工具标准]
    F --> G[Agent 决策系统]
    G --> H[Agent Skill 任务定制]

补充细节

把策略层、接入层、执行层搞清楚之后,许多MCP vs Skill的争论会自动消失。

  1. image-20260507103743471

Suggest Changes
Share this post on:

Previous Post
如何从0-1写一个vscode插件
Next Post
AI编码技巧分享