Экосистема ИИ-агентов развивается стремительно, и вместе с ней появляется специализированная терминология. Этот справочник объясняет ключевые понятия, необходимые для понимания того, как работает OpenClaw и ИИ-агенты в целом.
За общим введением в OpenClaw обратитесь к материалу что такое OpenClaw и как он работает.
А–Г
ИИ-агент
Программная система на базе языковой модели, способная автономно выполнять многошаговые задачи: планировать действия, использовать инструменты (браузер, файлы, API), наблюдать за результатами и корректировать поведение. В отличие от обычного чат-бота, агент не просто отвечает — он действует. OpenClaw — пример ИИ-агента с доступом к интерфейсу компьютера.
Agent Loop (цикл агента)
Повторяющийся цикл работы агента: получить инструкцию → спланировать → выполнить действие → наблюдать результат → принять следующее решение. Цикл продолжается до тех пор, пока задача не выполнена или не достигнут предел итераций. Количество шагов в цикле напрямую влияет на расход токенов и время выполнения.
Галлюцинация (Hallucination)
Ситуация, когда языковая модель генерирует уверенно звучащую, но фактически неверную информацию. В контексте агентов галлюцинации особенно опасны: агент может «придумать» результат вместо того, чтобы реально проверить его. OpenClaw снижает риск галлюцинаций, используя компьютерное зрение для верификации: агент видит реальный экран и не полагается только на то, что «знает» модель.
К–Л
Контекстное окно
Максимальный объём текста, который модель может «держать в голове» за одну сессию. Измеряется в токенах. Чем длиннее контекстное окно, тем более сложные и длинные задачи может выполнять агент без потери информации о предыдущих шагах. Современные модели имеют контекстные окна от 32K до 1M+ токенов.
LLM (большая языковая модель)
Large Language Model — нейросеть, обученная на огромных корпусах текста и способная генерировать, понимать и трансформировать текст. LLM — это «мозг» агента: именно она принимает решения о следующем шаге, интерпретирует увиденное на экране и формулирует действия. OpenClaw совместим с несколькими LLM — облачными и локальными.
Локальный запуск
Режим работы OpenClaw, при котором языковая модель и логика агента выполняются непосредственно на устройстве пользователя без отправки данных во внешние серверы. Требует достаточной вычислительной мощности (GPU с 8+ ГБ VRAM для большинства моделей). Обеспечивает полную конфиденциальность данных и работу без интернета.
М–О
MCP (Model Context Protocol)
Открытый протокол, разработанный Anthropic, для стандартизированного подключения LLM к внешним инструментам и источникам данных. MCP позволяет агентам безопасно взаимодействовать с файловой системой, базами данных, API и другими системами через единый унифицированный интерфейс. OpenClaw поддерживает MCP-серверы, что упрощает разработку собственных интеграций.
Мультимодальность
Способность модели работать с несколькими типами данных одновременно: текст, изображения, аудио, видео. Мультимодальность — ключевое свойство OpenClaw 2.0: агент понимает скриншоты экрана, распознаёт элементы интерфейса на изображениях и принимает голосовые команды. Без мультимодальности Computer Use невозможен.
Навык (в OpenClaw)
Атомарная способность агента, реализующая конкретный тип действий: «открыть браузер», «заполнить форму», «отправить email», «написать Python-скрипт». Навыки подключаются модульно — пользователь или разработчик может добавлять, настраивать и создавать собственные навыки. Каталог доступных навыков описан в разделе навыки OpenClaw.
О–П
Облачный запуск
Режим работы, при котором OpenClaw использует LLM через API облачного провайдера (NVIDIA Cloud, OpenAI, Anthropic и другие). Не требует мощного железа, но данные проходят через серверы провайдера. Оптимален для задач, где конфиденциальность не критична, и для использования наиболее мощных моделей.
Оркестратор
Компонент агентной системы, координирующий работу нескольких агентов или навыков. Оркестратор разбивает сложную задачу на подзадачи, распределяет их между исполнителями и собирает результаты. В OpenClaw встроенный оркестратор управляет последовательностью шагов и переключением между навыками в рамках одной задачи.
Permission Scope (область прав доступа)
Набор разрешений, выданных агенту для конкретной задачи или сессии. Принцип минимальных прав: агент должен иметь доступ только к тем ресурсам, которые нужны для выполнения текущей задачи. Например, задача «проверить почту» не должна давать агенту доступ к файлам. Настройка Permission Scope — важная часть безопасной работы с OpenClaw, подробнее в разделе безопасность.
Промпт
Текстовая инструкция, которую пользователь или система отправляет языковой модели. В контексте OpenClaw промпт — это задача, описанная пользователем. Чем точнее и конкретнее промпт, тем выше вероятность правильного выполнения. Хороший промпт для агента содержит: цель, источники данных, формат результата и ограничения.
Р–Т
RAG (Retrieval-Augmented Generation)
Архитектурный паттерн, при котором LLM перед генерацией ответа обращается к внешней базе знаний и использует найденные фрагменты как дополнительный контекст. Позволяет модели работать с актуальными данными, не попавшими в обучающую выборку. В OpenClaw RAG используется для навыков, требующих доступа к корпоративным базам знаний и документации.
Sandbox (изолированная среда)
Контролируемое окружение, в котором агент выполняет задачи с ограниченным доступом к реальной системе. Sandbox снижает риск необратимых действий при тестировании новых инструкций. OpenClaw поддерживает запуск в sandbox-режиме: агент видит виртуальный рабочий стол и работает с копиями файлов, не затрагивая основную систему.
Системный промпт
Инструкции для языковой модели, задающие её роль, поведение и ограничения. В отличие от пользовательского промпта, системный промпт невидим пользователю и устанавливается разработчиком или самим OpenClaw. Именно системный промпт определяет, как агент интерпретирует задачи, какие инструменты использует и как обрабатывает ошибки.
Т–Ф
Токен
Минимальная единица текста, с которой работает LLM. Грубо: 1 токен ≈ 0,75 слова на английском, для русского — около 0,5 слова из-за кириллицы. Стоимость использования облачных LLM измеряется в токенах. Длина задачи, история переписки и размер контекста — всё это влияет на расход токенов и, соответственно, на стоимость выполнения.
Tool Use (использование инструментов)
Механизм, позволяющий LLM вызывать внешние функции и API: поиск в интернете, выполнение кода, обращение к базе данных. Без Tool Use модель ограничена только генерацией текста. В OpenClaw каждый навык реализован как инструмент, доступный модели через стандартизированный интерфейс.
Ф–Я
Fine-tuning (дообучение)
Процесс дополнительного обучения предобученной LLM на специализированном датасете для улучшения её работы в конкретной предметной области. Дообученная модель лучше справляется с узкими задачами (например, юридические документы или медицинские записи), но требует значительных вычислительных ресурсов и данных для обучения.
Computer Use
Способность ИИ-агента воспринимать графический интерфейс компьютера (через скриншоты) и взаимодействовать с ним (клики, ввод текста, прокрутка). Computer Use — ключевая технология OpenClaw: агент «видит» экран так же, как человек, и управляет любым приложением без необходимости в специальном API. Именно эта технология позволяет автоматизировать программы, которые не имеют публичного API.
Для понимания того, как эти технологии применяются на практике, изучите раздел сценарии использования и возможности интеграций OpenClaw.