Зачем этот глоссарий
При работе с OpenClaw вы постоянно встречаете термины из мира AI и языковых моделей. Этот словарь объясняет ключевые понятия простым языком — без академической сложности, с практическими примерами применительно к OpenClaw.
Базовые термины
Токен (Token)
Минимальная единица текста, которую обрабатывает языковая модель. Токен — это не всегда слово: короткие слова могут быть одним токеном, длинные — несколькими, а знаки препинания — отдельными токенами.
Примеры:
- «кот» → 1-2 токена
- «автоматизация» → 3-4 токена
- «OpenClaw» → 2-3 токена
Правило большого пальца: 1000 токенов ≈ 750 слов на английском, ≈ 600 слов на русском (из-за кириллицы).
Почему важно для OpenClaw: каждый запрос к API стоит пропорционально количеству токенов. Понимание токенизации помогает оптимизировать расходы.
Контекстное окно (Context Window)
Максимальный объём текста, который языковая модель может «видеть» и учитывать одновременно. Всё, что выходит за пределы контекстного окна — модель не помнит.
Аналогия: представьте, что вы читаете книгу через трубочку, и можете видеть только несколько страниц одновременно. Что было раньше — недоступно.
Актуальные лимиты:
| Модель | Контекст |
|---|---|
| GPT-4o | 128 000 токенов (~96 000 слов) |
| Claude Sonnet | 200 000 токенов (~150 000 слов) |
| Gemini 1.5 Pro | 1 000 000 токенов (~750 000 слов) |
Для OpenClaw: длинные сессии, большие файлы конфигурации и история действий «съедают» контекст. Подробнее: context overflow.
Промпт (Prompt)
Инструкция или запрос, который вы отправляете языковой модели. Всё что вы пишете агенту — это промпт.
Типы промптов в OpenClaw:
- System prompt — базовые инструкции (AGENTS.md, SOUL.md), загружаются автоматически
- User prompt — ваша конкретная задача: «найди все PDF в папке Downloads»
- Assistant prompt — предыдущие ответы модели, часть истории разговора
Prompt engineering — искусство составления эффективных промптов. Чем точнее инструкция, тем лучше результат.
Галлюцинация (Hallucination)
Ситуация, когда языковая модель уверенно генерирует неверную информацию. Модель «придумывает» факты, которых не существует: несуществующие ссылки, неверные даты, ошибочные технические детали.
Пример: агент уверенно называет «статью закона №245 ч.3» — но такой статьи не существует.
Почему происходит: модели оптимизированы на генерацию связного текста, а не на точность фактов. При отсутствии нужных знаний — генерируют правдоподобное, а не истинное.
Как снизить риск в OpenClaw:
- Просить агента ссылаться только на данные из конкретных файлов
- Включать
behavior.verifyBeforeReference: true - Для критичных фактов — всегда верифицировать по первоисточникам
Температура (Temperature)
Параметр, управляющий «креативностью» модели. Значение от 0 до 1 (иногда до 2).
- Температура 0 — детерминированные, предсказуемые ответы. Одинаковый вопрос → одинаковый ответ.
- Температура 0.7 — баланс между точностью и вариативностью (часто используется по умолчанию).
- Температура 1.0+ — максимальная креативность, высокий риск нерелевантных ответов.
В OpenClaw:
{
"llm": {
"temperature": 0.2 // для кодинга и точных задач
}
}
{
"llm": {
"temperature": 0.8 // для генерации текста и идей
}
}
Инференс (Inference)
Процесс генерации ответа языковой моделью — «мышление» модели по вашему запросу. Когда вы отправляете задачу агенту и ждёте ответа — происходит инференс.
Скорость инференса измеряется в токенах/секунду:
- GPT-4o через API: ~100 токенов/сек
- Claude Sonnet: ~80 токенов/сек
- Llama 3.3 на Mac Mini M4: ~40 токенов/сек
- Llama 3.3 на CPU VPS: ~5 токенов/сек
Эмбеддинг (Embedding)
Числовое представление текста в многомерном пространстве. Тексты со схожим смыслом получают близкие эмбеддинги — это позволяет находить семантически похожее содержимое.
Где встречается в OpenClaw: в механизмах семантического поиска по документам, в системах памяти агента, в RAG (Retrieval-Augmented Generation).
Простая аналогия: слова «кот» и «кошка» получат близкие числовые координаты, а «кот» и «самолёт» — далёкие.
RAG (Retrieval-Augmented Generation)
Техника, при которой перед генерацией ответа агент извлекает релевантные фрагменты из базы знаний и добавляет их в контекст.
Зачем нужно: языковые модели не знают вашу внутреннюю документацию, базу знаний, закрытые данные. RAG позволяет агенту работать с вашими данными без дообучения.
Пример в OpenClaw:
Вопрос: "Какова наша политика возврата товаров?"
RAG:
1. Ищет в базе знаний: "политика возврат" → находит relevantный раздел
2. Добавляет его в контекст запроса
3. GPT-4o отвечает на основе реального документа, а не из обучения
Параметры запроса
Max Tokens
Максимальное количество токенов в ответе модели. Если ответ будет длиннее — обрезается.
{
"llm": {
"maxTokens": 2000 // ограничить ответы до ~1500 слов
}
}
Важно для контроля расходов: output-токены обычно в 3-5 раз дороже input.
Top-P (Nucleus Sampling)
Параметр, управляющий разнообразием ответов. Модель выбирает следующий токен из набора наиболее вероятных вариантов, суммарная вероятность которых = top_p.
- top_p = 0.1 — очень консервативный выбор, почти детерминированный
- top_p = 0.9 — широкий выбор, более разнообразные ответы
Используется совместно с temperature. В большинстве случаев достаточно настроить только temperature.
Стоп-последовательность (Stop Sequence)
Строка, при появлении которой модель прекращает генерацию. Используется для контроля формата ответов.
{
"llm": {
"stopSequences": ["</output>", "DONE", "---END---"]
}
}
Полезно когда нужен структурированный вывод: агент генерирует ровно до маркера конца.
Архитектурные термины
Fine-tuning (Дообучение)
Процесс дополнительного обучения базовой модели на специфических данных для улучшения в конкретной области. Например, дообучить GPT-4o на медицинских текстах.
Для OpenClaw: не используется напрямую. Вместо fine-tuning — AGENTS.md, SOUL.md и правильные промпты.
Few-shot Learning
Техника, при которой в промпт включаются примеры желаемого поведения. Модель «учится» на этих примерах в рамках одного запроса.
Плохой промпт: "Классифицируй отзывы"
Few-shot промпт:
"Классифицируй отзывы. Примеры:
'Отличный товар!' → позитивный
'Бракованная вещь, не рекомендую' → негативный
'Обычный товар, ничего особенного' → нейтральный
Теперь классифицируй: 'Быстрая доставка, но упаковка мятая'"
Системный промпт (System Prompt)
Инструкции, которые модель получает до пользовательского сообщения. Задаёт контекст, роль и правила поведения модели.
В OpenClaw системный промпт формируется автоматически из AGENTS.md + SOUL.md + WORKSPACE.md.
Следующий глоссарий — технические термины интеграций: MCP, API, webhook. Для понимания как контекстное окно влияет на работу: context overflow в OpenClaw.
contextWindow vs contextTokens в OpenClaw: в чём разница
Двa параметра в ~/.openclaw/settings.json, которые часто путают:
-
contextWindow— максимальный размер контекста модели в токенах (например, 200000 для Claude Sonnet 4.6, 1000000 для Sonnet 4.6 в 1M-режиме). Это архитектурный лимит самой LLM, его нельзя превысить. -
contextTokens— рабочий лимит для OpenClaw: сколько токенов агент готов в реальности набирать, прежде чем запустить авто-сжатие истории (compaction). Обычно ставится 70–80% отcontextWindow, чтобы оставить запас на ответ модели и системные сообщения.
Пример:
{
"model": "claude-sonnet-4-6",
"contextWindow": 200000, // лимит модели
"contextTokens": 150000 // когда хочу включить compaction
}
Если contextTokens поставить равным contextWindow, агент будет упираться в hard-лимит и падать с ошибкой context overflow. Если поставить сильно меньше — будете чаще терять историю при сжатии. Золотая середина — 75%.