如今 AI 术语无处不在,当每个人似乎都在说着另一种语言时,很容易让人感到不知所措。如果你曾在某个谈话中听到有人提到 “Sandbox”、“RAG” 或 “MCP”,却在会议室里跟着点头,而心里其实对这些术语一知半解,那么这份指南正是为你准备的。
技术发展迅速,但理解基础并不需要技术背景。以下是大家最常遇到的 AI 术语的直白解释,用通俗的语言按顺序讲解,帮助你逐步建立理解。

1. 核心 AI 概念
AI 模型
将 AI 模型想象成一个聪明的计算机程序,旨在模仿人类的思考。你向它输入一些内容——比如一个问题或一张图片——它处理这些信息并生成有意义的输出。模型通过分析海量示例、识别模式并逐步改进理解与响应的能力来进行学习。
若想深入了解 AI 模型以及如何高效部署它们,请查看我们的 Novita AI 模型部署指南。
神经网络
神经网络可以被看作是人脑工作方式的简化版本。它由相互连接的节点(称为人工神经元)组成,彼此传递信息,就像我们大脑中的神经元一样。这些网络通过调整节点之间连接的权重来更好地识别模式和做出决策——和我们从经验中学习的过程类似。神经网络按层组织:输入层接收数据,隐藏层通过复杂的数学函数处理数据,输出层产生最终结果。深度学习中的“深”指的是拥有许多隐藏层的网络,使其能够学习越来越复杂的模式。

Transformer 架构
Transformer 是突破性技术,让当今的智能 AI 成为可能。在 2017 年之前,AI 必须逐字阅读文本,就像用手指一个字一个字地读书。Transformer 改变了这一点,它让 AI 能够同时看到一句话中的所有词,并通过一种称为“注意力”的机制理解它们之间的关系。这就像一次读一个词与瞬间理解整个句子之间的区别。注意力机制允许模型在生成输出的每个部分时,专注于输入中相关的部分,从而更有效地理解语言中的上下文和关系。
大型语言模型 (LLM)
LLM 是专门训练用于理解和生成人类语言的 AI 模型。它们阅读了数十亿个单词,学会预测句子中下一个词是什么,从而能够撰写文章、回答问题或进行自然对话。在训练过程中,它们分析文本中的模式,以理解语法、上下文和含义。现代 LLM 已演变为多模态模型,意味着它们不仅能处理文本,还能处理图像、音频等——所有这些都在一个界面内完成。例如,GPT-4o 可以同时接收文本、语音和图像,使交互更加丰富和多样化。“大型”是指存储模型所学知识的参数数量极其庞大(通常达数十亿)。
人工通用智能 (AGI)
AGI 是 AI 的圣杯——一个在每个领域都像人类一样聪明,而不仅仅是擅长特定任务的系统。尽管今天的 AI 在写作或图像识别等特定方面表现出色,但 AGI 将在创造力、推理、学习和问题解决等任何领域与人类智能相匹配。从科学角度看,实现 AGI 需要解决包括迁移学习(跨领域应用知识)、少样本学习(从少量示例中学习)、因果推理以及开发更高效学习算法在内的根本性挑战。当前的 AI 系统被认为是“窄”智能,因为它们擅长特定任务,但缺乏人类认知所具有的通用智能和适应性。
AI 对齐
AI 对齐是指确保 AI 系统与人类想要的东西一致,并按有利于而非危害我们的方式行事。随着 AI 变得越来越强大,确保它共享我们的价值观和目标变得越来越重要。可以将其理解为确保 AI 是我们这一边的。这涉及价值学习(教会 AI 理解人类偏好)、鲁棒性(确保 AI 在新情况下正确行为)和可解释性(理解 AI 做出某些决定的原因)等技术挑战。对齐研究还涉及哲学问题,例如与谁的价值观对齐,以及如何处理相互冲突的人类偏好。
2. 数据与训练
训练数据
训练数据就是用来教会 AI 模型的所有信息——可以把它想象成 AI 的教科书。对于语言模型来说,这包括数百万本书、网站、新闻文章和其他书面内容。这些“阅读材料”越多样、质量越高,AI 处理不同主题和情况的能力就越强。数据质量至关重要:有偏见或不正确的训练数据会导致有偏见或不正确的 AI 输出。训练过程涉及向模型展示无数示例,使其学习数据中的统计模式和关系。
预训练
预训练就像 AI 上小学——模型在此阶段学习基础知识。在此期间,AI 读取海量文本,学习语言的基本模式、关于世界的事实以及如何推理。这本质上是在 AI 专门从事特定领域之前进行的通识教育。预训练使用无监督学习,意味着模型在没有显式标签或答案的情况下学习模式。这一阶段计算成本高昂,通常需要在强大的计算机集群上花费数周或数月,但它创建了一个通用知识基础,可以应用于许多不同的任务。
微调
微调就像毕业后的专业培训。一旦 AI 通过预训练完成了通识教育,就可以针对特定类型的内容或任务进行进一步训练。例如,通用 AI 可能在医学期刊上进行微调,以更好地回答医疗保健问题,或者在客服对话上进行训练,以采用公司特定的语气和风格。这个过程所需的数据和计算资源比预训练少得多,因为模型已经理解了语言基础。微调会调整模型参数,以优化特定领域或应用的性能,同时保留通用能力。
基于人类反馈的强化学习 (RLHF)
RLHF 就像让人类老师批改 AI 的作业,并告诉它什么样的答案是好的。人类对不同的 AI 响应进行评分,模型学会输出人们认为有用、准确且恰当的答案。这个过程对于让 AI 系统按我们期望的方式行为至关重要。RLHF 通常包括三个步骤:基于人类偏好训练奖励模型,使用强化学习根据该奖励模型优化 AI 行为,并通过更多人类反馈迭代改进。该技术有助于使 AI 行为与人类价值观对齐,并减少有害或 unwanted 的输出。
3. 输入与输出机制
Token (词元)
Token 基本上是 AI 用来“计数”文本的单位——大致一个 token 对应一个单词,但也可能是单词的一部分、标点符号甚至空格。AI 模型对一次能处理的 token 数量有限制(称为上下文窗口),这就是为什么它们有时无法处理非常长的文档或记住长对话中的所有内容。不同语言和书写系统需要不同的分词策略。理解 token 很重要,因为 AI 模型按 token 顺序处理文本,而 token 限制决定了输入长度以及对话中的记忆范围。
推理
推理就是 AI 执行任务的那一刻——接收你的输入并产生输出。当你向 ChatGPT 输入一个问题并得到回答时,那就是在推理。这与训练不同,训练是 AI 从数据中学习。推理时,模型使用其学习到的参数处理新输入并生成响应。这个过程比训练快得多,资源消耗也少,但对于大型模型来说仍需要大量计算能力。推理质量既取决于模型的训练,也取决于输入是否与模型之前见过的模式相匹配。
提示工程
提示工程是以正确方式向 AI 提出正确问题的艺术与科学。就像用清晰、具体的问题向某人提问比模糊的问题能得到更好的答案一样,设计好的提示可以显著改善你从 AI 获得的结果。有效的提示通常包括清晰的指令、相关的上下文、期望输出格式的示例以及具体的约束条件或要求。高级技术包括思维链提示(要求 AI 展示推理过程)、少样本学习(提供示例)和提示链(将复杂任务分解为步骤)。目标是清晰传达意图,同时优化模型的性能发挥。
幻觉
当 AI 出现“幻觉”时,它在编造听起来可信但并非真实的内容。当 AI 试图填补其知识空白,或被问到它并不真正理解的问题时,就会发生这种情况。就像有人自信地给你指路,但从未去过那个地方——自信并不能让指路正确。幻觉之所以发生,是因为语言模型被训练来生成听起来合理的文本,而不一定是准确的信息。它们可以在保持自信语气的同时编造事实、引用或细节。理解这一局限性对于负责任的 AI 使用至关重要,核实事实和验证来源等技术仍然很重要。

4. AI 工具与高级应用
应用程序编程接口 (API)
API 就像餐厅里的服务员——它把你的订单(请求)送到厨房(AI 系统),然后带回你的食物(响应)。在 AI 世界中,API 让不同的软件程序能够与 AI 模型通信,而无需从零开始构建 AI。公司可以通过 API 接入现有的 AI 服务。API 定义了请求和响应的具体格式,包括最大输出长度、创造性程度(temperature)和响应格式等参数。它们处理身份验证、速率限制和错误管理,使开发者可以轻松地将 AI 功能集成到应用程序、网站或服务中,而无需深厚的 AI 专业知识。
多模态 AI
多模态 AI 可以同时处理不同类型的内容——文本、图像、语音和视频。就像和一个能同时看到你展示的东西、听到你说话、读懂你写的内容的人交谈一样。这使得 AI 交互感觉更加自然和人性化。多模态模型针对不同输入类型使用不同的神经网络架构(图像用视觉 Transformer,声音用音频编码器),但在统一的表示空间中组合它们。这使得 AI 能够理解不同模态之间的关系,例如描述视频中发生的事情或回答关于图像的问题。
检索增强生成 (RAG)
RAG 就像在 AI 回答问题时给它一个最新的图书馆访问权限。RAG 系统不是仅使用训练期间学到的知识,而是在生成响应之前搜索最新的数据库和文档以找到相关信息。这有助于确保答案准确且时效性强。RAG 分两步工作:首先,检索系统根据查询搜索相关文档或信息;然后,语言模型结合其训练知识和检索到的信息生成响应。这种方法减少了幻觉,能够获取最新信息,并允许 AI 使用专有或专业的知识库。
本文可帮助你了解更多:什么是 RAG:检索增强生成全面介绍
沙箱 (Sandbox)
沙箱就像是 AI 的安全围栏——一个安全、隔离的环境,AI 可以在其中运行代码、访问工具或进行实验,而不会对你的主系统造成任何风险。就像让孩子在一个围起来的区域内玩耍,不会碰坏重要东西。沙箱使用容器化、虚拟机或其他隔离技术创建受控环境,限制对系统资源、网络连接和敏感数据的访问。这使得 AI 代理能够执行代码、与 API 交互或测试解决方案,同时防止潜在的安全漏洞、数据损坏或系统损坏。
这是一个比较复杂的概念,如果你想深入探索,我们有一篇很棒的文章可以深入了解:代理沙箱如何驱动安全、可扩展的 AI 创新。
LLM 专用端点
LLM 专用端点就像一条与特定 AI 模型直接连接的专用电话线,针对你的特定需求进行了优化。你不会与其他人共享资源,而是获得一个可针对你的具体用例进行定制的专用连接。这涉及到设置隔离的计算资源(GPU、内存、带宽),并配置响应速度、输出风格、安全过滤器和性能保证等自定义选项。专用端点能提供一致的延迟、更高的吞吐量,并且能够专门为你的应用程序微调模型,同时确保数据隐私并满足企业安全要求。
本文可帮助你了解更多:Novita AI 上的 LLM 专用端点:自定义模型、按使用量计费和无运维扩展。
模型上下文协议 (MCP)
MCP 是一种新兴标准,它让 AI 模型能够以一致的方式与外部工具和服务连接。AI 不再只是生成文本,现在可以安排你的会议、更新你的日历或从你的数据库中提取信息。从技术角度看,MCP 创建了一个标准化的通信协议,允许 AI 通过定义的接口和权限安全地与不同软件系统交互。这将 AI 从被动的响应者转变为可以采取实际行动的主动助手,同时通过受控的访问模式和审计追踪来维护安全性。
以下文章可帮助你了解更多:什么是 MCP?开发者模型上下文协议指南 *。
人工智能是一个快速发展的领域,它将基础概念、高级工具和伦理考量结合起来,创造出能够改变行业的强大系统。随着 AI 的持续进步,了解其概念和应用是释放其全部潜力的关键。过渡到动手实践也是跟上最新发展并获得实践经验的好方法。
限时福利:新用户可领取 10 美元免费额度,在 Novita AI 上使用 LLM API 进行探索和构建。 不要错过这个深入 AI 世界、将创意变为现实的机会!
关于 Novita AI
Novita AI 是一个 AI 云平台,为开发者提供简单 API 部署 AI 模型的便捷方式,同时还提供经济实惠且可靠的 GPU 云用于构建和扩展。
