infoclaw.ru
  • Что такое OpenClaw
  • Установка
  • Навыки
  • Интеграции
  • Сравнения
  • Новости
FAQ
  1. Главная
  2. Что такое OpenClaw
  3. Как работает OpenClaw: архитектура и принципы
Что такое OpenClaw

Как работает OpenClaw: архитектура и принципы

Архитектура OpenClaw изнутри: LLM-бэкенд, computer use API, система навыков, локальное и облачное выполнение, модель разрешений.

18 марта 2026 г. · 6 мин чтения
Как работает OpenClaw: архитектура и принципы

Общая архитектура OpenClaw

OpenClaw — это ИИ-агент, который получает текстовую команду от пользователя и самостоятельно выполняет её, управляя операционной системой так же, как это делает человек: кликает мышью, вводит текст, открывает приложения, читает содержимое экрана.

Архитектура агента состоит из четырёх ключевых слоёв:

  1. LLM-ядро — языковая модель, которая «понимает» задачу и принимает решения.
  2. Tool Use / Computer Use API — механизм вызова инструментов и управления компьютером.
  3. Система навыков (Skills) — модульные сценарии для повторяемых задач.
  4. Слой разрешений — контроль того, что агент может делать, а что нет.

Все слои взаимодействуют через единый оркестратор — центральный компонент, который координирует выполнение задачи от первого шага до финального результата.

Подробное введение в возможности агента — в полном гиде по OpenClaw.

LLM-ядро: мозг агента

OpenClaw не привязан к одной языковой модели. Архитектура спроектирована как model-agnostic: можно использовать GPT-4o, Claude Sonnet, Gemini 1.5, Llama 3.3 или любую другую модель с поддержкой function calling / tool use.

Как LLM принимает решения

Когда пользователь отправляет команду, например «скачай прикреплённый PDF из последнего письма в Gmail», происходит следующее:

  1. Оркестратор формирует промпт с описанием задачи, доступных инструментов и текущего состояния системы.
  2. LLM возвращает не просто текст, а структурированный вызов инструмента: browser.navigate("https://gmail.com").
  3. Оркестратор выполняет вызов и возвращает результат (скриншот, HTML, текст) обратно в модель.
  4. Модель анализирует результат и делает следующий шаг.

Этот цикл «наблюдение → мышление → действие» повторяется до выполнения задачи или достижения лимита шагов.

Поддерживаемые провайдеры

  • OpenAI (GPT-4o, GPT-4.1)
  • Anthropic (Claude Sonnet, Claude Opus)
  • Google (Gemini 1.5 Pro, Gemini 2.0)
  • Ollama (локальные модели: Llama, Mistral, Qwen)
  • LM Studio и любой OpenAI-совместимый API

Computer Use API: как агент управляет компьютером

OpenClaw управляет компьютером через несколько механизмов в зависимости от задачи:

Браузер

Для работы с браузером используется Playwright — библиотека автоматизации, которая управляет Chrome, Firefox и Safari через DevTools Protocol. Агент может:

  • Переходить по URL и кликать по элементам.
  • Заполнять формы и отправлять данные.
  • Делать скриншоты и читать DOM-дерево страницы.
  • Перехватывать сетевые запросы.

Файловая система

Работа с файлами выполняется через встроенные Node.js API с проверкой разрешений:

  • Чтение, запись, перемещение, удаление файлов.
  • Рекурсивный обход директорий.
  • Работа с архивами ZIP/TAR.

Нативные приложения

Управление нативными приложениями (Telegram, VS Code, Finder, и др.) реализовано через Accessibility API операционной системы:

  • На macOS — через AXUIElement и AppleScript.
  • На Windows — через UI Automation API.
  • На Linux — через AT-SPI (Assistive Technology Service Provider Interface).

Агент «видит» элементы интерфейса как дерево объектов и может взаимодействовать с ними программно, без скриншотов.

Скриншоты и компьютерное зрение

Когда структурированный доступ к UI недоступен, OpenClaw делает скриншот экрана и передаёт его в мультимодальную LLM. Модель определяет, что находится на экране, и указывает координаты для клика.

Этот режим медленнее, но универсален — работает с любым приложением.

Gateway: сетевой слой OpenClaw (порт 18789)

OpenClaw запускается как долгоживущий сервис Node.js, который открывает HTTP/WebSocket-сервер на порту 18789 — это и есть Gateway. Через него проходит всё взаимодействие: команды от мессенджеров, запросы от Desktop App, API-вызовы от внешних систем (TaskFlows Webhook).

Почему порт 18789

18789 — нестандартный порт вне диапазона «известных» сервисов (1–1023). Это снижает вероятность конфликтов с другим ПО. При желании изменить его — через openclaw.json:

{
  "gateway": {
    "listen": {
      "port": 9999,
      "host": "127.0.0.1"
    }
  }
}

Критически важно: host: "127.0.0.1" означает, что Gateway доступен только с локальной машины. Если изменить на 0.0.0.0 — Gateway становится доступен из сети. Никогда не делайте это без firewall и аутентификации.

Channels vs Skills: принципиальное различие

Многие путают эти два понятия. Они работают на разных уровнях:

Channels (Каналы)Skills (Навыки)
УровеньТранспортныйФункциональный
Отвечает на вопросОткуда агент получает команды?Что агент умеет делать?
ПримерыTelegram, Slack, WhatsApp, Discord, REST APIАнализ файла, отправка email, git push, SEO-аудит
Количество50+ из коробки6000+ в ClawHub
Конфигchannels в openclaw.json~/.openclaw/skills/
АналогияТелефонная линияТо, что вы говорите по телефону

Канал — это «вход» для команд. Навык — это «инструмент» для выполнения команды.

Пример: вы пишете в Telegram (канал) «проанализируй мой сайт» → агент использует навык SEO-аудита (скилл) для выполнения.

Система навыков (Skills)

Навыки OpenClaw — это переиспользуемые модули автоматизации. Каждый навык описывает конкретный сценарий: «ответить на письмо», «сделать скриншот и отправить в Slack», «запустить тесты и исправить ошибки».

Структура навыка

Каждый навык представляет собой Markdown-файл (SKILL.md) с описанием и опциональным JavaScript/Python-кодом:

skill-name/
  SKILL.md        # описание и инструкции для LLM
  handler.js      # (опционально) логика выполнения
  schema.json     # (опционально) параметры навыка

Загрузка и выполнение навыков

При старте OpenClaw сканирует директорию ~/.openclaw/skills/ и загружает все доступные навыки. Когда пользователь даёт команду, оркестратор выбирает наиболее подходящий навык или строит план выполнения из нескольких навыков последовательно.

Навыки можно создавать самостоятельно или скачивать из реестра сообщества.

Локальное vs облачное выполнение

OpenClaw поддерживает два режима работы:

ПараметрОблако (GPT/Claude)Локально (Ollama)
СкоростьВысокаяЗависит от железа
ПриватностьДанные уходят в APIПолная приватность
КачествоОтличноеХорошее
СтоимостьПо тарифу APIБесплатно
Работа офлайнНетДа

Для задач с конфиденциальными данными рекомендуется локальный режим. Для повседневных задач — облачный, он точнее и быстрее.

Модель разрешений

OpenClaw работает по принципу явного согласия: агент не может выполнить действие, которое не разрешено в конфигурации.

Разрешения делятся на три уровня:

  • Автоматические — чтение файлов из разрешённых директорий, навигация в браузере.
  • С подтверждением — отправка сообщений, запись файлов, запуск программ.
  • Всегда запрещено — доступ к паролям, системным файлам, операции за пределами явно разрешённых областей.

Пользователь задаёт разрешения в config.json. При попытке выполнить несанкционированное действие агент останавливается и запрашивает подтверждение.

Как изучить возможности глубже

Понимание архитектуры помогает эффективнее использовать агента:

  • Изучите систему навыков, чтобы создавать собственные автоматизации.
  • Подключите интеграции для расширения возможностей.
  • Сравните провайдеры в разделе сравнений, чтобы выбрать оптимальную модель для своих задач.
Теги: архитектурапринцип работыOpenClawИИ-агент

Вам также может быть интересно

Что такое OpenClaw

Что такое OpenClaw: полный гид по первому вирусному ИИ-агенту 2026 года

15 марта 2026 г. 8 мин
💰
Инструмент Калькулятор стоимости AI-моделей Сравните цены GPT-4o, Claude, DeepSeek за минуту
→
🎯
Квиз · 2 мин Какой OpenClaw подходит вам? 5 вопросов — персональная рекомендация
→

Популярное

  1. Moltbook: соцсеть для AI-агентов с 1,5 миллиона ботов Что такое OpenClaw
  2. OpenClaw купил автомобиль: как AI-агент сэкономил $4,200 Сценарии использования
  3. Multi-agent в OpenClaw: как запустить команду AI-агентов Сценарии использования
  4. Что такое OpenClaw: полный гид по первому вирусному ИИ-агенту 2026 года Что такое OpenClaw
  5. OpenClaw 2026.6.6-beta.1: Существенное повышение безопасности и стабильности Новости

Категории

  • Что такое OpenClaw (8)
  • Установка (16)
  • Навыки (11)
  • Интеграции (15)
  • Сравнения (9)
  • Сценарии использования (22)
  • Новости (66)
  • Enterprise / NemoClaw (7)
  • Безопасность (10)
  • Сообщество (1)
  • Для разработчиков (6)
  • Вопросы и ответы (2)
  • Глоссарий (4)

Недавнее

  • OpenClaw 2026.6.6-beta.1: Существенное повышение безопасности и стабильности сегодня
  • Обновление OpenClaw 2026.6.5: улучшенная стабильность и новый встроенный поисковый провайдер Parallel вчера
  • Обновление OpenClaw 2026.6.5-beta.5: повышение надёжности и новые возможности интеграций 2 дн. назад

Быстрый старт

Новичок в OpenClaw? Начните отсюда:

  • → Что такое OpenClaw
  • → Установка за 10 минут
  • → Топ-10 навыков
  • → Подключить Telegram

Теги

установканавыкиtelegramwhatsappmacoswindowsenterpriseголосopen-sourcellmprivacynode.js
infoclaw.ru

Независимый информационный ресурс об ИИ-агенте OpenClaw. Статьи, гайды и новости на русском языке.

Разделы

  • Что такое OpenClaw
  • Установка
  • Навыки
  • Интеграции
  • Сравнения
  • Enterprise
  • Безопасность
  • Новости

Интеграции

  • Telegram
  • WhatsApp
  • Slack
  • Discord
  • iMessage
  • Teams
  • Matrix
  • Все (20+) →

Ресурсы

  • Вопросы и ответы
  • Глоссарий
  • Для разработчиков
  • Сообщество
  • Карта сайта

© 2026 infoclaw.ru — Независимый ресурс. Не является официальным сайтом проекта OpenClaw.

Политика конфиденциальности Пользовательское соглашение Контакты