AI大模型术语扫盲

戏说数据那点事 2025-02-20

大家好，我是杰哥。

【AI信息风向】每天早上 7点准时推送的 AI 资讯中，总是会出现一些 AI 大模型的术语，阻碍了我们的理解。那么今天就开始，为你进行一波 AI 大模型常见名词的扫盲，从而让你更容易看懂每日 AI 资讯，同时更加系统地了解 AI 大模型。

1. 什么是 Token？

在大语言模型（LLM）如 GPT-4o 中，文本的处理过程通常包括将输入文本转换成一系列 tokens，这些 tokens 是模型理解语言的基础。这个过程称为 tokenization（分词），不同的模型可能使用不同的方法来分词。以下是使用 GPT-4o 模型时的一个例子：

假设我们有以下句子：

"Hello, how are you doing today?"

在使用 GPT-4o 模型之前，这个句子需要被分词。在 GPT-4o 中，这个句子可能会被分词为以下 tokens 序列：

["Hello", ",", "how", "are", "you", "doing", "today", "?"]

在这个例子中，每个单词和标点符号都被当作一个单独的 token。注意，根据模型的具体实现，分词方式可能略有不同。例如，一些模型可能会将标点符号和它所附着的单词合并为一个 token，如将", "（逗号和一个空格）与"Hello"合并为"Hello,"。

对于中文文本，分词过程可能会更加复杂，因为中文文本没有明显的单词分隔符。例如，中文句子：

"你今天怎么样？"

在使用 GPT-4o 模型时，这个句子可能会被分词为：

["你", "今天", "怎么", "样", "？"]

在这个例子中，每个汉字都被单独作为一个 token。但是，实际的分词可能会根据模型的分词器和训练数据而有所不同。

重要的是，tokenization 是自然语言处理（NLP）任务中的一个关键步骤，它直接影响模型对文本的理解和处理能力。因此，开发者在使用 LLM 时需要确保文本被正确地分词，以便模型能够准确地进行预测和生成。

2. 什么是 Prompt？

Prompt 中文意思是“提示词”。它是给大模型的指令，是一个简短的文本输入，用于引导 AI 模型生成特定的回答或执行特定任务。

在人工智能领域，尤其是在自然语言处理（NLP）中，Prompt（提示）是一种向模型提供信息的方式，用以指导模型完成特定任务或生成特定类型的输出。简单来说，Prompt 是给模型的输入，它告诉模型需要做什么或者如何回应。

Prompt 的设计对于模型的输出质量至关重要。一个好的 Prompt 可以引导模型生成准确、相关且有用的回答。在实际应用中，设计有效的 Prompt 往往需要针对特定任务进行调整和优化。

3、什么是 LLM？

大语言模型（Large Language Models，简称 LLMs）是一类具有大量参数的机器学习模型，它们专门设计用来处理和生成人类语言。这些模型通过在大量的文本数据上进行训练，学习语言的语法、语义和上下文关系，从而能够执行各种复杂的自然语言处理（NLP）任务，如文本生成、翻译、摘要、问答等。