Глоссарий: ключевые термины ИИ-агентов и OpenClaw

Экосистема ИИ-агентов развивается стремительно, и вместе с ней появляется специализированная терминология. Этот справочник объясняет ключевые понятия, необходимые для понимания того, как работает OpenClaw и ИИ-агенты в целом.

За общим введением в OpenClaw обратитесь к материалу что такое OpenClaw и как он работает.

А–Г

ИИ-агент

Программная система на базе языковой модели, способная автономно выполнять многошаговые задачи: планировать действия, использовать инструменты (браузер, файлы, API), наблюдать за результатами и корректировать поведение. В отличие от обычного чат-бота, агент не просто отвечает — он действует. OpenClaw — пример ИИ-агента с доступом к интерфейсу компьютера.

Agent Loop (цикл агента)

Повторяющийся цикл работы агента: получить инструкцию → спланировать → выполнить действие → наблюдать результат → принять следующее решение. Цикл продолжается до тех пор, пока задача не выполнена или не достигнут предел итераций. Количество шагов в цикле напрямую влияет на расход токенов и время выполнения.

Галлюцинация (Hallucination)

Ситуация, когда языковая модель генерирует уверенно звучащую, но фактически неверную информацию. В контексте агентов галлюцинации особенно опасны: агент может «придумать» результат вместо того, чтобы реально проверить его. OpenClaw снижает риск галлюцинаций, используя компьютерное зрение для верификации: агент видит реальный экран и не полагается только на то, что «знает» модель.

К–Л

Контекстное окно

Максимальный объём текста, который модель может «держать в голове» за одну сессию. Измеряется в токенах. Чем длиннее контекстное окно, тем более сложные и длинные задачи может выполнять агент без потери информации о предыдущих шагах. Современные модели имеют контекстные окна от 32K до 1M+ токенов.

LLM (большая языковая модель)

Large Language Model — нейросеть, обученная на огромных корпусах текста и способная генерировать, понимать и трансформировать текст. LLM — это «мозг» агента: именно она принимает решения о следующем шаге, интерпретирует увиденное на экране и формулирует действия. OpenClaw совместим с несколькими LLM — облачными и локальными.

Локальный запуск

Режим работы OpenClaw, при котором языковая модель и логика агента выполняются непосредственно на устройстве пользователя без отправки данных во внешние серверы. Требует достаточной вычислительной мощности (GPU с 8+ ГБ VRAM для большинства моделей). Обеспечивает полную конфиденциальность данных и работу без интернета.

М–О

MCP (Model Context Protocol)

Открытый протокол, разработанный Anthropic, для стандартизированного подключения LLM к внешним инструментам и источникам данных. MCP позволяет агентам безопасно взаимодействовать с файловой системой, базами данных, API и другими системами через единый унифицированный интерфейс. OpenClaw поддерживает MCP-серверы, что упрощает разработку собственных интеграций.

Мультимодальность

Способность модели работать с несколькими типами данных одновременно: текст, изображения, аудио, видео. Мультимодальность — ключевое свойство OpenClaw 2.0: агент понимает скриншоты экрана, распознаёт элементы интерфейса на изображениях и принимает голосовые команды. Без мультимодальности Computer Use невозможен.

Навык (в OpenClaw)

Атомарная способность агента, реализующая конкретный тип действий: «открыть браузер», «заполнить форму», «отправить email», «написать Python-скрипт». Навыки подключаются модульно — пользователь или разработчик может добавлять, настраивать и создавать собственные навыки. Каталог доступных навыков описан в разделе навыки OpenClaw.

О–П

Облачный запуск

Режим работы, при котором OpenClaw использует LLM через API облачного провайдера (NVIDIA Cloud, OpenAI, Anthropic и другие). Не требует мощного железа, но данные проходят через серверы провайдера. Оптимален для задач, где конфиденциальность не критична, и для использования наиболее мощных моделей.

Оркестратор

Компонент агентной системы, координирующий работу нескольких агентов или навыков. Оркестратор разбивает сложную задачу на подзадачи, распределяет их между исполнителями и собирает результаты. В OpenClaw встроенный оркестратор управляет последовательностью шагов и переключением между навыками в рамках одной задачи.

Permission Scope (область прав доступа)

Набор разрешений, выданных агенту для конкретной задачи или сессии. Принцип минимальных прав: агент должен иметь доступ только к тем ресурсам, которые нужны для выполнения текущей задачи. Например, задача «проверить почту» не должна давать агенту доступ к файлам. Настройка Permission Scope — важная часть безопасной работы с OpenClaw, подробнее в разделе безопасность.

Промпт

Текстовая инструкция, которую пользователь или система отправляет языковой модели. В контексте OpenClaw промпт — это задача, описанная пользователем. Чем точнее и конкретнее промпт, тем выше вероятность правильного выполнения. Хороший промпт для агента содержит: цель, источники данных, формат результата и ограничения.

Р–Т

RAG (Retrieval-Augmented Generation)

Архитектурный паттерн, при котором LLM перед генерацией ответа обращается к внешней базе знаний и использует найденные фрагменты как дополнительный контекст. Позволяет модели работать с актуальными данными, не попавшими в обучающую выборку. В OpenClaw RAG используется для навыков, требующих доступа к корпоративным базам знаний и документации.

Sandbox (изолированная среда)

Контролируемое окружение, в котором агент выполняет задачи с ограниченным доступом к реальной системе. Sandbox снижает риск необратимых действий при тестировании новых инструкций. OpenClaw поддерживает запуск в sandbox-режиме: агент видит виртуальный рабочий стол и работает с копиями файлов, не затрагивая основную систему.

Системный промпт

Инструкции для языковой модели, задающие её роль, поведение и ограничения. В отличие от пользовательского промпта, системный промпт невидим пользователю и устанавливается разработчиком или самим OpenClaw. Именно системный промпт определяет, как агент интерпретирует задачи, какие инструменты использует и как обрабатывает ошибки.

Т–Ф

Токен

Минимальная единица текста, с которой работает LLM. Грубо: 1 токен ≈ 0,75 слова на английском, для русского — около 0,5 слова из-за кириллицы. Стоимость использования облачных LLM измеряется в токенах. Длина задачи, история переписки и размер контекста — всё это влияет на расход токенов и, соответственно, на стоимость выполнения.

Tool Use (использование инструментов)

Механизм, позволяющий LLM вызывать внешние функции и API: поиск в интернете, выполнение кода, обращение к базе данных. Без Tool Use модель ограничена только генерацией текста. В OpenClaw каждый навык реализован как инструмент, доступный модели через стандартизированный интерфейс.

Ф–Я

Fine-tuning (дообучение)

Процесс дополнительного обучения предобученной LLM на специализированном датасете для улучшения её работы в конкретной предметной области. Дообученная модель лучше справляется с узкими задачами (например, юридические документы или медицинские записи), но требует значительных вычислительных ресурсов и данных для обучения.

Computer Use

Способность ИИ-агента воспринимать графический интерфейс компьютера (через скриншоты) и взаимодействовать с ним (клики, ввод текста, прокрутка). Computer Use — ключевая технология OpenClaw: агент «видит» экран так же, как человек, и управляет любым приложением без необходимости в специальном API. Именно эта технология позволяет автоматизировать программы, которые не имеют публичного API.

Для понимания того, как эти технологии применяются на практике, изучите раздел сценарии использования и возможности интеграций OpenClaw.

А–Г