Считайте стоимость задачи, не токена
За период вышло четыре практичных сюжета: два — про реальную экономику Claude Sonnet 4.6 и различия API, один — про то, как на самом деле устроен «автономный» multi-agent кейс Anthropic с C-компилятором, и один — про быстрый запуск Remotion с IDE+LLM для моушн-графики. Общий вывод: измеряйте cost-per-task на своих пайплайнах, фиксируйте требования к фичам провайдера и не переоценивайте «с нуля» без проверки границ результата.
Проблема «Token Muncher»: Sonnet 4.6 правда дешевле?
Для кого: CPO, Product Manager, Solo-Dev
Риск Sonnet 4.6: токены «съедаются». Sonnet 4.6 может оказаться дороже в пересчёте на выполненную задачу из‑за adaptive thinking: модель тратит больше токенов и времени, поэтому per-token цена перестаёт быть главным фактором бюджета. Проверяйте на своём наборе промптов/задач: input+output и фактические total tokens на задачу (и что именно биллится у провайдера).
- Artificial Analysis (total tokens на их прогоне):
- Sonnet 4.5: ~58M
- Sonnet 4.6: ~280M (более чем 4×)
- Opus 4.6: ~160M
- Заявление: Sonnet 4.6 ~40% дешевле Opus 4.6 per-token
- Практические метрики для сравнения:
- tokens-per-task
- cost-per-task
- latency-per-task
API «больше не равны». Один и тот же «бренд модели» через разных провайдеров может давать разные возможности, что влияет на архитектуру продукта и TCO. Фиксируйте функциональные требования и делайте smoke-тесты на критичных фичах.
- Риск: функциональный разъезд между хостингами/эндпойнтами
- Примеры провайдеров, которые сравниваются: Anthropic direct, GCP, AWS
- Фичи, которые стоит проверять как требования:
- tool calling
- sandbox/выполнение кода
- «компьютерное управление» и прочие capability-расширения
Anthropic построила C-компилятор
Для кого: CPO, Product Manager, Solo-Dev
Параметры multi-agent эксперимента. Ключевой материал — не «компилятор с нуля», а масштаб и цена оркестрации агентов: длительный автономный прогон с большим числом сессий и заметным API-бюджетом.
- Multi-agent harness: 16 агентов
- Длительность: почти 2 недели
- Объём: ~2000 cloud code sessions
- Стоимость: ~$20k API
- Результат: ~100k строк, Rust-based C compiler
- Заявление: сборка Linux 6.9 для x86/ARM/RISC-V
«С нуля» опирается на тесты и oracle. «Scratch» в этом кейсе опирался на зрелый тестовый корпус и сравнение с GCC как эталонным «онлайн-оракулом», что резко снижает неопределённость для автономных агентов.
- Тестовая база: GCC torture tests
- Валидация: сравнение поведения с GCC ("online oracle")
Пределы: 16-bit real-mode бутстрап. Тезис «компилирует Linux» имеет критичную оговорку: не закрыт 16-bit x86 codegen под real-mode бутстрап в нужных лимитах.
- Проблема: 16-bit x86 real mode codegen
- Ограничение Linux boot-кода: 32KB
- Факт: выход компилятора >60KB
Toolchain-ограничение: только компилятор. Пользовательские ожидания «как GCC» ломаются: проект не включает линкер/ассемблер, поэтому даже пример из README может не собраться без внешних компонентов toolchain.
- Упоминание: GitHub issue «hello world does not compile»
- Причина: нет линкера/ассемблера, не GCC-подобный driver
Sonnet съел Opus, США обвинили Nvidia, сломали защиту ИИ
Для кого: CPO, Product Manager, Solo-Dev, Productivity
Sonnet 4.6 как дефолт для кодинга. По словам автора, ранние пользователи чаще выбирают Sonnet 4.6 вместо более дорогого Opus из‑за лучшего следования инструкциям и более «аккуратного» кодинга, при этом цена не выросла и контекст огромный.
- Предпочтение Sonnet 4.6 вместо Opus 4.5: 60% случаев среди разработчиков с ранним доступом (по словам автора)
- В Claude Code: ~70% переключились с Sonnet 4.5 на Sonnet 4.6
- Цена:
- $3 / 1M input tokens
- $15 / 1M output tokens
- Контекст: 1 000 000 токенов
- Доступ: на всех тарифах (включая бесплатный), в Claude (web) и через API
Manus AI в Telegram без настройки. Агент встраивается в привычный канал с онбордингом «в 4 шага», без ключей и конфигов; заявлены функции ресерча, работы с данными и генерации отчётов/PDF, а также мульти-модальный ввод.
- Подключение: открыть вкладку → нажать кнопку → сканировать QR → агент появляется в чате
- Без: API-ключей и конфигов
- Доступность: на любом тарифе без доплат (по словам автора)
- Возможности:
- ресерч
- обработка данных
- отчёты и PDF
- Входы:
- голосовые (расшифровка)
- картинки (распознавание)
- файлы (обработка)
- Режимы:
- Manus 1.6 Max (глубокое рассуждение)
- Manus 1.6 Lite (быстрые ответы)
- Приватность (заявление продукта/автора): видит только прямые сообщения ему, без доступа к прочим чатам/группам/контактам
Remotion — Забудь After Effects и создавай моушн-графику промптом
Для кого: Solo-Dev, Productivity, Product Manager, CPO
Минимальный стартовый набор. Для быстрого входа в Remotion автор рекомендует Node.js и IDE с чат-ассистентом, чтобы править анимации промптами. Отдельно отмечается возможность подключать платные API моделей, а также использовать бесплатные модели с лимитами через OpenCode.
- Требования:
- Node.js (nodejs.org)
- OpenCode (opencode.ai)
- Альтернативы IDE: Cursor / VS Code
- LLM-доступ:
- платные API (Gemini/GPT/Claude)
- бесплатные модели с лимитами (в OpenCode)
Создание Remotion-проекта: команды. В видео показан прямой сценарий создания шаблона, установка зависимостей и запуск WebUI для предпросмотра.
- Команды:
cd Desktopnpx create-video@latest- согласиться на Tailwind CSS (Enter)
- согласиться на agent skills (Enter)
cd My Def Videonpm installnpm run def(открывается WebUI в браузере)
- Окружение: демонстрация на macOS; для Windows отличия минимальны (по словам автора)
Куда класть медиа и шрифты. Чтобы не тратить время на организацию ассетов, автор советует складывать всё в public.
- Открытие проекта: в OpenCode нажать «+» и выбрать директорию проекта
- Папка ассетов:
/public- логотипы
- SVG/JPG и др.
- файлы шрифтов
Сетап для вайб-кодинга анимаций. Режим работы: чат LLM в IDE + WebUI Remotion параллельно, чтобы итеративно описывать анимацию словами и сразу смотреть результат.
- Сетап: IDE/чат (OpenCode/Cursor) + WebUI Remotion в браузере
- Пример промпта (как в видео): интро, где «жирные Montserrat буквы вылетают со всех сторон, крутятся, прыгают… и собираются во фразу …»