infoclaw.ru
  • Что такое OpenClaw
  • Установка
  • Навыки
  • Интеграции
  • Сравнения
  • Новости
FAQ
  1. Главная
  2. Глоссарий
  3. Context window, токены, галлюцинация: глоссарий AI-агента
Глоссарий

Context window, токены, галлюцинация: глоссарий AI-агента

Словарь базовых терминов для работы с OpenClaw: контекстное окно, токены, температура, галлюцинации, prompt, inference — простыми словами с примерами.

23 марта 2026 г. · 6 мин чтения
Context window, токены, галлюцинация: глоссарий AI-агента

Зачем этот глоссарий

При работе с OpenClaw вы постоянно встречаете термины из мира AI и языковых моделей. Этот словарь объясняет ключевые понятия простым языком — без академической сложности, с практическими примерами применительно к OpenClaw.


Базовые термины

Токен (Token)

Минимальная единица текста, которую обрабатывает языковая модель. Токен — это не всегда слово: короткие слова могут быть одним токеном, длинные — несколькими, а знаки препинания — отдельными токенами.

Примеры:

  • «кот» → 1-2 токена
  • «автоматизация» → 3-4 токена
  • «OpenClaw» → 2-3 токена

Правило большого пальца: 1000 токенов ≈ 750 слов на английском, ≈ 600 слов на русском (из-за кириллицы).

Почему важно для OpenClaw: каждый запрос к API стоит пропорционально количеству токенов. Понимание токенизации помогает оптимизировать расходы.


Контекстное окно (Context Window)

Максимальный объём текста, который языковая модель может «видеть» и учитывать одновременно. Всё, что выходит за пределы контекстного окна — модель не помнит.

Аналогия: представьте, что вы читаете книгу через трубочку, и можете видеть только несколько страниц одновременно. Что было раньше — недоступно.

Актуальные лимиты:

МодельКонтекст
GPT-4o128 000 токенов (~96 000 слов)
Claude Sonnet200 000 токенов (~150 000 слов)
Gemini 1.5 Pro1 000 000 токенов (~750 000 слов)

Для OpenClaw: длинные сессии, большие файлы конфигурации и история действий «съедают» контекст. Подробнее: context overflow.


Промпт (Prompt)

Инструкция или запрос, который вы отправляете языковой модели. Всё что вы пишете агенту — это промпт.

Типы промптов в OpenClaw:

  • System prompt — базовые инструкции (AGENTS.md, SOUL.md), загружаются автоматически
  • User prompt — ваша конкретная задача: «найди все PDF в папке Downloads»
  • Assistant prompt — предыдущие ответы модели, часть истории разговора

Prompt engineering — искусство составления эффективных промптов. Чем точнее инструкция, тем лучше результат.


Галлюцинация (Hallucination)

Ситуация, когда языковая модель уверенно генерирует неверную информацию. Модель «придумывает» факты, которых не существует: несуществующие ссылки, неверные даты, ошибочные технические детали.

Пример: агент уверенно называет «статью закона №245 ч.3» — но такой статьи не существует.

Почему происходит: модели оптимизированы на генерацию связного текста, а не на точность фактов. При отсутствии нужных знаний — генерируют правдоподобное, а не истинное.

Как снизить риск в OpenClaw:

  • Просить агента ссылаться только на данные из конкретных файлов
  • Включать behavior.verifyBeforeReference: true
  • Для критичных фактов — всегда верифицировать по первоисточникам

Температура (Temperature)

Параметр, управляющий «креативностью» модели. Значение от 0 до 1 (иногда до 2).

  • Температура 0 — детерминированные, предсказуемые ответы. Одинаковый вопрос → одинаковый ответ.
  • Температура 0.7 — баланс между точностью и вариативностью (часто используется по умолчанию).
  • Температура 1.0+ — максимальная креативность, высокий риск нерелевантных ответов.

В OpenClaw:

{
  "llm": {
    "temperature": 0.2  // для кодинга и точных задач
  }
}
{
  "llm": {
    "temperature": 0.8  // для генерации текста и идей
  }
}

Инференс (Inference)

Процесс генерации ответа языковой моделью — «мышление» модели по вашему запросу. Когда вы отправляете задачу агенту и ждёте ответа — происходит инференс.

Скорость инференса измеряется в токенах/секунду:

  • GPT-4o через API: ~100 токенов/сек
  • Claude Sonnet: ~80 токенов/сек
  • Llama 3.3 на Mac Mini M4: ~40 токенов/сек
  • Llama 3.3 на CPU VPS: ~5 токенов/сек

Эмбеддинг (Embedding)

Числовое представление текста в многомерном пространстве. Тексты со схожим смыслом получают близкие эмбеддинги — это позволяет находить семантически похожее содержимое.

Где встречается в OpenClaw: в механизмах семантического поиска по документам, в системах памяти агента, в RAG (Retrieval-Augmented Generation).

Простая аналогия: слова «кот» и «кошка» получат близкие числовые координаты, а «кот» и «самолёт» — далёкие.


RAG (Retrieval-Augmented Generation)

Техника, при которой перед генерацией ответа агент извлекает релевантные фрагменты из базы знаний и добавляет их в контекст.

Зачем нужно: языковые модели не знают вашу внутреннюю документацию, базу знаний, закрытые данные. RAG позволяет агенту работать с вашими данными без дообучения.

Пример в OpenClaw:

Вопрос: "Какова наша политика возврата товаров?"

RAG:
1. Ищет в базе знаний: "политика возврат" → находит relevantный раздел
2. Добавляет его в контекст запроса
3. GPT-4o отвечает на основе реального документа, а не из обучения

Параметры запроса

Max Tokens

Максимальное количество токенов в ответе модели. Если ответ будет длиннее — обрезается.

{
  "llm": {
    "maxTokens": 2000  // ограничить ответы до ~1500 слов
  }
}

Важно для контроля расходов: output-токены обычно в 3-5 раз дороже input.


Top-P (Nucleus Sampling)

Параметр, управляющий разнообразием ответов. Модель выбирает следующий токен из набора наиболее вероятных вариантов, суммарная вероятность которых = top_p.

  • top_p = 0.1 — очень консервативный выбор, почти детерминированный
  • top_p = 0.9 — широкий выбор, более разнообразные ответы

Используется совместно с temperature. В большинстве случаев достаточно настроить только temperature.


Стоп-последовательность (Stop Sequence)

Строка, при появлении которой модель прекращает генерацию. Используется для контроля формата ответов.

{
  "llm": {
    "stopSequences": ["</output>", "DONE", "---END---"]
  }
}

Полезно когда нужен структурированный вывод: агент генерирует ровно до маркера конца.


Архитектурные термины

Fine-tuning (Дообучение)

Процесс дополнительного обучения базовой модели на специфических данных для улучшения в конкретной области. Например, дообучить GPT-4o на медицинских текстах.

Для OpenClaw: не используется напрямую. Вместо fine-tuning — AGENTS.md, SOUL.md и правильные промпты.


Few-shot Learning

Техника, при которой в промпт включаются примеры желаемого поведения. Модель «учится» на этих примерах в рамках одного запроса.

Плохой промпт: "Классифицируй отзывы"

Few-shot промпт:
"Классифицируй отзывы. Примеры:
'Отличный товар!' → позитивный
'Бракованная вещь, не рекомендую' → негативный
'Обычный товар, ничего особенного' → нейтральный

Теперь классифицируй: 'Быстрая доставка, но упаковка мятая'"

Системный промпт (System Prompt)

Инструкции, которые модель получает до пользовательского сообщения. Задаёт контекст, роль и правила поведения модели.

В OpenClaw системный промпт формируется автоматически из AGENTS.md + SOUL.md + WORKSPACE.md.


Следующий глоссарий — технические термины интеграций: MCP, API, webhook. Для понимания как контекстное окно влияет на работу: context overflow в OpenClaw.


contextWindow vs contextTokens в OpenClaw: в чём разница

Двa параметра в ~/.openclaw/settings.json, которые часто путают:

  • contextWindow — максимальный размер контекста модели в токенах (например, 200000 для Claude Sonnet 4.6, 1000000 для Sonnet 4.6 в 1M-режиме). Это архитектурный лимит самой LLM, его нельзя превысить.

  • contextTokens — рабочий лимит для OpenClaw: сколько токенов агент готов в реальности набирать, прежде чем запустить авто-сжатие истории (compaction). Обычно ставится 70–80% от contextWindow, чтобы оставить запас на ответ модели и системные сообщения.

Пример:

{
  "model": "claude-sonnet-4-6",
  "contextWindow": 200000,   // лимит модели
  "contextTokens": 150000    // когда хочу включить compaction
}

Если contextTokens поставить равным contextWindow, агент будет упираться в hard-лимит и падать с ошибкой context overflow. Если поставить сильно меньше — будете чаще терять историю при сжатии. Золотая середина — 75%.

Теги: глоссарийтерминыcontext windowтокеныгаллюцинацияpromptLLM

Вам также может быть интересно

Что такое OpenClaw

Что такое OpenClaw: полный гид по первому вирусному ИИ-агенту 2026 года

15 марта 2026 г. 8 мин
Установка

OpenClaw context overflow: как решить переполнение контекста

23 марта 2026 г. 6 мин
Установка

Сколько стоит OpenClaw: как оптимизировать расходы на токены

23 марта 2026 г. 6 мин
💰
Инструмент Калькулятор стоимости AI-моделей Сравните цены GPT-4o, Claude, DeepSeek за минуту
→
🎯
Квиз · 2 мин Какой OpenClaw подходит вам? 5 вопросов — персональная рекомендация
→

Популярное

  1. Moltbook: соцсеть для AI-агентов с 1,5 миллиона ботов Что такое OpenClaw
  2. OpenClaw купил автомобиль: как AI-агент сэкономил $4,200 Сценарии использования
  3. Multi-agent в OpenClaw: как запустить команду AI-агентов Сценарии использования
  4. Что такое OpenClaw: полный гид по первому вирусному ИИ-агенту 2026 года Что такое OpenClaw
  5. OpenClaw 2026.6.6-beta.1: Существенное повышение безопасности и стабильности Новости

Категории

  • Что такое OpenClaw (8)
  • Установка (16)
  • Навыки (11)
  • Интеграции (15)
  • Сравнения (9)
  • Сценарии использования (22)
  • Новости (66)
  • Enterprise / NemoClaw (7)
  • Безопасность (10)
  • Сообщество (1)
  • Для разработчиков (6)
  • Вопросы и ответы (2)
  • Глоссарий (4)

Недавнее

  • OpenClaw 2026.6.6-beta.1: Существенное повышение безопасности и стабильности сегодня
  • Обновление OpenClaw 2026.6.5: улучшенная стабильность и новый встроенный поисковый провайдер Parallel вчера
  • Обновление OpenClaw 2026.6.5-beta.5: повышение надёжности и новые возможности интеграций 2 дн. назад

Быстрый старт

Новичок в OpenClaw? Начните отсюда:

  • → Что такое OpenClaw
  • → Установка за 10 минут
  • → Топ-10 навыков
  • → Подключить Telegram

Теги

установканавыкиtelegramwhatsappmacoswindowsenterpriseголосopen-sourcellmprivacynode.js
infoclaw.ru

Независимый информационный ресурс об ИИ-агенте OpenClaw. Статьи, гайды и новости на русском языке.

Разделы

  • Что такое OpenClaw
  • Установка
  • Навыки
  • Интеграции
  • Сравнения
  • Enterprise
  • Безопасность
  • Новости

Интеграции

  • Telegram
  • WhatsApp
  • Slack
  • Discord
  • iMessage
  • Teams
  • Matrix
  • Все (20+) →

Ресурсы

  • Вопросы и ответы
  • Глоссарий
  • Для разработчиков
  • Сообщество
  • Карта сайта

© 2026 infoclaw.ru — Независимый ресурс. Не является официальным сайтом проекта OpenClaw.

Политика конфиденциальности Пользовательское соглашение Контакты