«Какой нужен Mac mini для OpenClaw?», «Хватит ли MacBook Pro M4 48GB?», «CPU vs GPU — что важнее?» — частые вопросы. Короткий ответ: для облачного режима хватит любого Mac с 8 ГБ RAM; для локального через Ollama — нужны хотя бы 16 ГБ, лучше 32+. Дальше — детально, по чипам и сценариям.
Главное за минуту
| Сценарий | Минимум | Рекомендация | Комфорт |
|---|---|---|---|
| Облако (Claude/GPT API) + лёгкие задачи | M1, 8 ГБ | M2/M3, 16 ГБ | любой |
| Облако + параллельные MCP, Playwright | M2, 16 ГБ | M3 Pro, 24 ГБ | M4 Pro, 32 ГБ |
| Локальная LLM 7–8B (Ollama) | M2, 16 ГБ | M3, 24 ГБ | M4, 32 ГБ |
| Локальная LLM 14B | M3 Pro, 32 ГБ | M4 Pro, 48 ГБ | M4 Max, 64 ГБ |
| Локальная LLM 30–34B | M3 Max, 64 ГБ | M4 Max, 96 ГБ | M4 Ultra, 128 ГБ |
| Локальная LLM 70B | M4 Max, 128 ГБ | M4 Ultra, 192 ГБ | M3/M4 Ultra Studio |
Почему Apple Silicon хорош для LLM
Главное преимущество — unified memory architecture (UMA): CPU, GPU и Neural Engine используют одну общую память. Модель в 30 ГБ помещается в GPU без копирования через шину PCIe, как на классических PC с дискретной видеокартой. Это даёт Mac неожиданно высокую производительность на инференсе, особенно для моделей, которые не помещаются в обычные потребительские GPU.
CPU vs GPU на Mac: что использует Ollama
Современный Ollama (с октября 2025) использует Metal GPU-ускорение по умолчанию на Apple Silicon. На больших моделях GPU быстрее CPU в 4–8 раз.
Однако есть нюансы:
- При нехватке VRAM-аналога Ollama роняется на CPU автоматически — производительность падает в 5–10 раз.
- Очень маленькие модели (≤3B) на M-чипах иногда быстрее на CPU — оверхед на GPU-сетап превышает выигрыш.
- Команда
OLLAMA_USE_METAL=0принудительно переключает на CPU (полезно для отладки).
MacBook Pro M4 48 ГБ: CPU vs GPU модели — конкретный замер
Самый частый запрос — что выбрать в M4 Pro/Max с 48 ГБ. Замеры на типичных задачах OpenClaw (Llama 3.1 8B, генерация 500 токенов):
| Режим | Tokens/sec | Время первого токена |
|---|---|---|
| GPU (Metal, дефолт) | 58 | 320 мс |
| CPU only | 11 | 1100 мс |
| GPU + 4 параллельных запроса | 14 каждый | 350 мс |
Вывод: на M4 Pro 48 ГБ всегда GPU. CPU-режим имеет смысл только если параллельно крутите видеомонтаж/3D и хотите оставить GPU свободным.
Mac mini для OpenClaw: какой нужен
Mac mini — идеальная «домашняя LLM-станция»: тихий, недорогой, всегда включён.
| Модель | Цена ~ | Сценарий |
|---|---|---|
| Mac mini M2 16 ГБ | от 65 тыс ₽ | Облако + лёгкие локальные задачи (Llama 3 8B) |
| Mac mini M4 16 ГБ | от 60 тыс ₽ (2025+) | То же, но быстрее на 30–40% |
| Mac mini M4 24 ГБ | от 90 тыс ₽ | Комфортная локальная работа с 8–14B |
| Mac mini M4 Pro 48 ГБ | от 150 тыс ₽ | Локальный LLM-сервер для команды до 5 чел. |
| Mac mini M4 Pro 64 ГБ | от 180 тыс ₽ | Модели до 30B + параллельные сессии |
Для большинства задач OpenClaw — Mac mini M4 с 24 ГБ — sweet spot. Подробнее про сравнение с VPS — Mac mini vs VPS для OpenClaw.
MacBook Air vs MacBook Pro
- Air (M2/M3/M4) — пассивное охлаждение. На длинных сессиях с локальной LLM начинает троттлить через 10–15 минут. Подходит для облачного режима OpenClaw.
- Pro — активное охлаждение, держит максимальную частоту часами. Обязателен, если планируете локальные LLM или долгие Playwright-сессии.
Тонкости настройки на Apple Silicon
- Node.js — арм64-сборку, не x64 через Rosetta. Проверка:
node -p "process.arch"→arm64. - Python с Homebrew arm64, не системный (он x86_64).
- Playwright — установите arm64-браузеры:
PLAYWRIGHT_BROWSERS_PATH=0 npx playwright install. - Ollama — официальная сборка, не Docker-версия (Docker на Mac работает в VM и теряет 30–40% производительности).
Сравнение поколений: M1 → M4 на инференсе Llama 3.1 8B
| Чип | tokens/sec | Замечание |
|---|---|---|
| M1 (8 ГБ) | 18 | OK для облака, тесно для локальной LLM |
| M2 Pro (16 ГБ) | 32 | Комфортный минимум для 8B |
| M3 Pro (18 ГБ) | 41 | Хороший рабочий уровень |
| M4 Pro (48 ГБ) | 58 | Запас под 14B и параллельные сессии |
| M4 Max (64 ГБ) | 78 | Профессиональный сетап |
| M4 Ultra (128+ ГБ) | 95+ | Может крутить 70B |
(Замеры в стандартных условиях, Ollama 0.5+, Llama 3.1 8B Q4_K_M.)
Что не покупать «впрок»
- Не берите 8 ГБ RAM — даже под облако OpenClaw + браузер + Playwright уже тесно.
- Не переплачивайте за Pro/Max ради OpenClaw, если работаете в облаке — производительность упирается в сеть и API, а не в CPU.
- Не берите Air для долгих локальных задач — троттлинг убивает преимущества чипа.