Context window, токены, галлюцинация: глоссарий AI-агента

Question 1

Токен (Token)

Accepted Answer

Минимальная единица текста, которую обрабатывает языковая модель. Токен — это не всегда слово: короткие слова могут быть одним токеном, длинные — несколькими, а знаки препинания — отдельными токенами. Примеры: - «кот» → 1-2 токена

Question 2

Контекстное окно (Context Window)

Accepted Answer

Максимальный объём текста, который языковая модель может «видеть» и учитывать одновременно. Всё, что выходит за пределы контекстного окна — модель не помнит. Аналогия: представьте, что вы читаете книгу через трубочку, и можете видеть только несколько страниц одновременно. Что было раньше — недоступно. Актуальные лимиты:

Question 3

Промпт (Prompt)

Accepted Answer

Инструкция или запрос, который вы отправляете языковой модели. Всё что вы пишете агенту — это промпт. Типы промптов в OpenClaw: - System prompt — базовые инструкции (AGENTS.md, SOUL.md), загружаются автоматически

Question 4

Галлюцинация (Hallucination)

Accepted Answer

Ситуация, когда языковая модель уверенно генерирует неверную информацию. Модель «придумывает» факты, которых не существует: несуществующие ссылки, неверные даты, ошибочные технические детали. Пример: агент уверенно называет «статью закона №245 ч.3» — но такой статьи не существует. Почему происходит: модели оптимизированы на генерацию связного текста, а не на точность фактов. При отсутствии нужных

Question 5

Температура (Temperature)

Accepted Answer

Параметр, управляющий «креативностью» модели. Значение от 0 до 1 (иногда до 2). - Температура 0 — детерминированные, предсказуемые ответы. Одинаковый вопрос → одинаковый ответ. - Температура 0.7 — баланс между точностью и вариативностью (часто используется по умолчанию).

Question 6

Инференс (Inference)

Accepted Answer

Процесс генерации ответа языковой моделью — «мышление» модели по вашему запросу. Когда вы отправляете задачу агенту и ждёте ответа — происходит инференс. Скорость инференса измеряется в токенах/секунду: - GPT-4o через API: ~100 токенов/сек

Question 7

Эмбеддинг (Embedding)

Accepted Answer

Числовое представление текста в многомерном пространстве. Тексты со схожим смыслом получают близкие эмбеддинги — это позволяет находить семантически похожее содержимое. Где встречается в OpenClaw: в механизмах семантического поиска по документам, в системах памяти агента, в RAG (Retrieval-Augmented Generation). Простая аналогия: слова «кот» и «кошка» получат близкие числовые координаты, а «кот» и

Question 8

RAG (Retrieval-Augmented Generation)

Accepted Answer

Техника, при которой перед генерацией ответа агент извлекает релевантные фрагменты из базы знаний и добавляет их в контекст. Зачем нужно: языковые модели не знают вашу внутреннюю документацию, базу знаний, закрытые данные. RAG позволяет агенту работать с вашими данными без дообучения. Пример в OpenClaw:

Question 9

Max Tokens

Accepted Answer

Максимальное количество токенов в ответе модели. Если ответ будет длиннее — обрезается. { "llm": {

Question 10

Top-P (Nucleus Sampling)

Accepted Answer

Параметр, управляющий разнообразием ответов. Модель выбирает следующий токен из набора наиболее вероятных вариантов, суммарная вероятность которых = top_p. - top_p = 0.1 — очень консервативный выбор, почти детерминированный - top_p = 0.9 — широкий выбор, более разнообразные ответы

Question 11

Стоп-последовательность (Stop Sequence)

Accepted Answer

Строка, при появлении которой модель прекращает генерацию. Используется для контроля формата ответов. { "llm": {

Question 12

Fine-tuning (Дообучение)

Accepted Answer

Процесс дополнительного обучения базовой модели на специфических данных для улучшения в конкретной области. Например, дообучить GPT-4o на медицинских текстах. Для OpenClaw: не используется напрямую. Вместо fine-tuning — AGENTS.md, SOUL.md и правильные промпты. ---

Question 13

Few-shot Learning

Accepted Answer

Техника, при которой в промпт включаются примеры желаемого поведения. Модель «учится» на этих примерах в рамках одного запроса. Плохой промпт: "Классифицируй отзывы" Few-shot промпт:

Question 14

Системный промпт (System Prompt)

Accepted Answer

Инструкции, которые модель получает до пользовательского сообщения. Задаёт контекст, роль и правила поведения модели. В OpenClaw системный промпт формируется автоматически из AGENTS.md + SOUL.md + WORKSPACE.md. ---

Модель	Контекст
GPT-4o	128 000 токенов (~96 000 слов)
Claude Sonnet	200 000 токенов (~150 000 слов)
Gemini 1.5 Pro	1 000 000 токенов (~750 000 слов)

Context window, токены, галлюцинация: глоссарий AI-агента

Зачем этот глоссарий

Базовые термины

Токен (Token)

Контекстное окно (Context Window)

Промпт (Prompt)

Галлюцинация (Hallucination)

Температура (Temperature)

Инференс (Inference)

Эмбеддинг (Embedding)

RAG (Retrieval-Augmented Generation)

Параметры запроса

Max Tokens

Top-P (Nucleus Sampling)

Стоп-последовательность (Stop Sequence)

Архитектурные термины

Fine-tuning (Дообучение)

Few-shot Learning

Системный промпт (System Prompt)

`contextWindow` vs `contextTokens` в OpenClaw: в чём разница

Зачем этот глоссарий

Базовые термины

Токен (Token)

Контекстное окно (Context Window)

Промпт (Prompt)

Галлюцинация (Hallucination)

Температура (Temperature)

Инференс (Inference)

Эмбеддинг (Embedding)

RAG (Retrieval-Augmented Generation)

Параметры запроса

Max Tokens

Top-P (Nucleus Sampling)

Стоп-последовательность (Stop Sequence)

Архитектурные термины

Fine-tuning (Дообучение)

Few-shot Learning

Системный промпт (System Prompt)

contextWindow vs contextTokens в OpenClaw: в чём разница

Вам также может быть интересно

Что такое OpenClaw: полный гид по первому вирусному ИИ-агенту 2026 года

OpenClaw context overflow: как решить переполнение контекста

Сколько стоит OpenClaw: как оптимизировать расходы на токены

`contextWindow` vs `contextTokens` в OpenClaw: в чём разница