
概述
在 AI 时代下,涌现出大量相关术语。这些术语涵盖了 AI 的基础概念、分支领域、技术架构、应用场景等多个方面。本文旨在通过通俗易懂的方式,为您汇总并解释这些核心概念。
目录
- 一、 核心概念:大模型与 Token
- 二、 宏观视角:AI 的基础分类
- 三、 学习范式:AI 是如何进化的?
- 四、 深度解析:底层架构与运行逻辑
- 五、 落地应用:生成技术与交互艺术
- 六、 进阶认知:从“智能体”到“对齐”
- 七、 核心工程:让模型更好用的黑科技

AI 基础术语汇总
一、 核心概念:大模型与 Token
1. 大模型 (Large Model / Foundation Model)
- 定义:一般指参数量达到数十亿甚至数万亿级别的深度学习模型。它们在海量数据上进行预训练,具备强劲的泛化能力,可以适应多种下游任务。
- 通俗理解:就像一个读过万卷书、走过万里路、博学多才的“超级专家”。由于它见多识广,所以你问它什么,它都能给你像模像样的回答。
2. Token (令牌/词元)
- 定义:AI 模型处理文本的最小单位。在 LLM 中,文本会被拆解成一个个 Token 进行计算。一个 Token 可能是单词、汉字、甚至是一个字符。
- 通俗理解:就像乐高积木。AI 不直接读文章,而是把文章拆成一块块积木(Token),处理完后再把积木拼回文字。一般 1000 个 Token 约等于 750 个汉字。

二、 宏观视角:AI 的基础分类
1. 人工智能 (AI, Artificial Intelligence)
- 深度定义:这是一个宽泛的学科领域,旨在研究和开发能够模拟、延伸和扩展人类智能的理论、方法及技术系统。它不仅包含机器人,还包括语音识别、图像识别、自然语言处理和专家系统等。
- 发展阶段:AI 的发展经历了从早期的“基于规则”到目前的“基于数据学习”的飞跃。
- 通俗理解:让机器变得像人一样机智,能听、能看、能思考、能解决问题。
2. 狭义人工智能 (ANI, Artificial Narrow Intelligence)
- 核心特点:也称为“弱人工智能”,这是我们目前所处的阶段。它被设计用来处理特定的、单一的任务,在特定领域的表现可能远超人类,但无法将这种能力迁移到其他领域。
- 典型案例:AlphaGo(只会下围棋)、Siri(语音助手)、垃圾邮件过滤器。
- 通俗理解:术业有专攻的“偏才”。它在球场上是巨星,但离开球场就什么都不会了。
3. 通用人工智能 (AGI, Artificial General Intelligence)
- 核心特点:也称为“强人工智能”。这是 AI 研究的“圣杯”。它具备人类水平的认知能力,能够像人类一样学习、理解、推理和应对完全陌生的环境和任务。
- 当前状态:目前仍处于研发和理论阶段,虽然大模型展示了一些苗头,但尚未真正实现。
- 通俗理解:科幻电影里的那种“全能机器人”,具备独立思考和学习能力,什么都能干。
4. ⚡ 人工超级智能 (ASI, Artificial Superintelligence)
- 核心特点:这是一种假设性的智能水平。它在科学创造力、社交技巧和通用智慧等所有领域都远超最机智的人类。
- 潜在影响:它被认为可能引发“技术奇点”,即技术发展速度超出人类理解和预测的范畴。
- 通俗理解:它的智慧不仅是“天才”的集合,而是人类无法想象的“神级”存在。

三、 学习范式:AI 是如何进化的?
为了方便理解,下表对比了三种主流的机器学习方式:
|
学习范式 |
核心特点 |
通俗类比 |
典型应用 |
|
监督学习 |
使用带标签的数据 |
跟着老师做有答案的练习题 |
垃圾邮件分类、人脸识别 |
|
无监督学习 |
处理无标签数据,寻找规律 |
自己在森林里探索物种分类 |
客户群组分析、降维 |
|
强化学习 |
通过奖惩机制优化策略 |
训练小狗通过动作获得零食 |
AlphaGo、自动驾驶 |
1. 监督学习 (Supervised Learning)
- 技术深度:模型通过学习大量的“输入-输出”对(即标签数据)来建立映射关系。其核心在于损失函数 (Loss Function) 的最小化,即不断缩小模型预测值与真实答案之间的差距。
- 通俗理解:就像是有标准答案的模拟考试。你做的题越多,对照答案修正的次数越多,你正式考试时的准确率就越高。
2. 无监督学习 (Unsupervised Learning)
- 技术深度:模型处理的是没有标签的数据,其目标是发现数据内在的统计结构或特征。它不需要人类告知它什么是对的,而是通过计算数据点之间的**类似度(如距离)**来进行归类。
- 通俗理解:就像把一堆乱七八糟的积木交给孩子,不告知他怎么摆,他可能会自己按照颜色或者形状把积木分成几堆。
3. 强化学习 (Reinforcement Learning, RL)
- 技术深度:这是一种基于“试错”的学习机制。智能体在环境中采取行动,环境会给予奖励 (Reward) 或 惩罚 (Penalty)。其目标是学习一个策略 (Policy),使得长期累积的奖励最大化。
- 通俗理解:就像训练宠物。做对了给肉吃,做错了没奖励。宠物为了吃到更多的肉,会逐渐学会一系列复杂的动作组合。
四、 深度解析:底层架构与运行逻辑
1. ️ 神经网络 (NN, Neural Network)
- 核心原理:受到生物神经系统的启发,通过多层“神经元”(数学函数)对输入数据进行非线性变换。
- 通俗理解:一个极其复杂的“自动筛选器”,第一层看轮廓,第二层看形状,第三层看物体,最终得出结论。
2. Transformer 架构:现代 AI 的心脏
- 背景:2017 年由 Google 提出,彻底取代了早期的 RNN(循环神经网络)。
- 核心机制:自注意力 (Self-Attention):技术解释:它允许模型在处理一个词时,同时“注视”句子中所有的词,并计算它们之间的关联程度。通俗理解:当你读到“它”这个词时,Transformer 能瞬间联系到前文提到的“猫”,从而清楚“它”指代谁。这种“全局视野”是 AI 变得机智的关键。
- 并行计算:不同于老技术必须一个词一个词地读,Transformer 可以同时处理整段话,这让训练超大规模模型成为可能。
3. 大语言模型 (LLM) 的运行逻辑
- 本质:概率预测:技术解释:LLM 的核心任务是根据给定的上文(Context),预测下一个 Token 出现的概率分布。通俗理解:它本质上是在玩一个极其高级的“接龙游戏”。当你输入“床前明月”,模型预测“光”出现的概率最高,于是它输出了“光”。
- 涌现能力 (Emergent Abilities):现象:当模型参数量突破某个临界点(如百亿级)时,它会突然掌握之前不具备的能力,如复杂推理、理解幽默等。通俗理解:就像量变引起质变,书读得足够多之后,模型突然“开窍”了。

五、 落地应用:生成技术与交互艺术
1. AIGC (AI Generated Content, 人工智能生成内容)
- 技术深度:标志着 AI 从“感知/识别世界”向“创造世界”的跨越。目前主流图像生成采用 扩散模型 (Diffusion Models)。
- 通俗理解:AI 艺术家、AI 作家、AI 程序员。它不再只是帮你分类邮件,而是能帮你画出一张不存在的画,或者写一段复杂的代码。
2. 多模态 (Multimodal)
- 技术深度:旨在让 AI 同时处理并理解文字、图像、语音等异构数据。
- 通俗理解:AI 的“全感官进化”。它不仅能读懂你的文字指令,还能看懂你发给它的图片,甚至能听出你说话时的情绪。
3. ✍️ 提示工程 (Prompt Engineering)
- 常用策略:包括 Few-shot (少样本提示) 和 CoT (思维链) 等,旨在引导 AI 输出更高质量的结果。
- 通俗理解:学习如何跟 AI 打交道的“对话艺术”或“咒语学”。

六、 进阶认知:从“智能体”到“对齐”
1. ️ 智能体 (Agent)
- 定义:具备自主感知、决策、规划和工具使用能力的 AI 系统。
- 为什么不做一个通用的全能智能体?:专项分工在专注度、工具管理、成本效率、稳定性四个维度具有显著优势。
- 通俗理解:你的“数字员工”。财务、技术、销售各司其职,效率和专业度才是最高的。
2. ⚖️ 对齐 (Alignment)
- 定义:确保 AI 的目标、行为和价值观与人类保持一致。
- 通俗理解:防止 AI “走歪路”。确保它在执行任务时,不会为了达成目标而采取违背人类道德的手段。
3. 幻觉 (Hallucination)
- 定义:AI 模型自信地输出捏造或不实的信息。
- 通俗理解:AI 在“一本正经地胡说八道”。
4. ️ 微调 (Fine-tuning)
- 定义:在通用大模型基础上,使用特定数据再次训练,使其适配特定领域。
- 通俗理解:让“全科医生”去修一个“专科进阶课”。

七、 ️ 核心工程:让模型更好用的黑科技
1. RAG (检索增强生成)
- 通俗理解:给 AI 开了一场“开卷考试”。AI 不再只凭记忆回答,而是先翻翻你给它的参考资料再说。
2. RLHF (人类反馈强化学习)
- 通俗理解:给 AI 请了一个“人类教练”。通过人类打分来调教 AI 的说话风格和安全性。
3. 参数量 (Parameters)
- 通俗理解:AI 大脑中“脑细胞”连接的密度。
4. 上下文窗口 (Context Window)
- 通俗理解:AI 的“短时记忆”容量,决定了它一次能处理多长的文档。
5. ️ 向量数据库 (Vector Database)
- 通俗理解:AI 的“超级图书馆索引”。按“意思相近”检索,速度极快。
6. MoE (混合专家模型)
- 通俗理解:根据任务自动分流给最擅长的“专科子模型”处理。
总结
AI 的世界日新月异,掌握这些核心术语是理解这一轮技术变革的第一步。从 Token 到大模型,从监督学习到 AIGC,AI 正在从一个工具变成我们每个人的智能助手。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...





