YinNews
ArticlesProjectsAbout

Recent Posts

27 фев., 04:00Нет обновлений
26 фев., 16:00Нет обновлений
26 фев., 04:00Антидистилляция: API под промышленной атакой
25 фев., 16:01Автономные агенты: риск разрушительных действий
25 фев., 04:01AI как sales-оператор в inbox
24 фев., 16:01Анти-абьюз и юридические риски LLM
24 фев., 04:01Контекст в файлах и копирование поведения
23 фев., 16:01Мультиязычный LLM на edge за копейки
23 фев., 04:00Нет обновлений
22 фев., 16:01Мини‑TTS на edge и быстрые ассистенты
CPOSolo-Dev
22 фев., 04:00Нет обновлений
21 фев., 16:01AI-инструменты упираются в one-click
21 фев., 04:00Нет обновлений
20 фев., 16:00AI-агенты вредят OSS без ограничений
20 фев., 04:01Токены подписок под запретом, thinking — настраиваемый
19 фев., 17:45Нет обновлений
19 фев., 07:00Нет обновлений
18 фев., 19:02Считайте стоимость задачи, не токена
18 фев., 07:00Нет обновлений
17 фев., 19:02Локальные ассистенты и тяжелые MoE
22 фев., 16:01

Мини‑TTS на edge и быстрые ассистенты

CPOSolo-DevProduct ManagerProductivity2 videos

За последние 12 часов фокус сместился в сторону «лёгкого» продакшена: модели и инструменты, которые проще встроить в продукт без сложной инфраструктуры. Два практичных сюжета: микроскопический TTS для edge/клиента и быстрый запуск AI-ассистента с базой знаний.

KittenTTS — The Nano TTS

Для кого: CPO, Product Manager, Solo-Dev, Productivity

Размеры моделей и квантование до ~25MB. KittenTTS доступен в нескольких вариантах, где ключевая ценность — минимальный размер весов для распространения и встраивания.

  • Mini: 80M параметров (~80MB на диске)
  • Micro: 40M параметров
  • Nano: 15M параметров
  • Nano 8-bit quantized: ~25MB
  • Всего: 3 модели + сжатая версия самой маленькой schedule00:14

Сценарии деплоя: edge/браузер/мобайл и CPU-only. Размер и позиционирование моделей позволяют рассматривать запуск без GPU на конечных устройствах и потенциально в клиенте.

  • Заявлено: CPU optimized, GPU не требуется
  • Подходящие цели: lightweight deployment
  • Автор отдельно отмечает возможность быстрой загрузки в браузер и идеи формата Chrome extension schedule01:33

Лицензия и стадия проекта. Для продуктовой интеграции важны и юридика, и зрелость релиза.

  • Статус: developer preview
  • Лицензия: Apache-2.0 (упрощает коммерческое использование и встраивание)
  • На Hugging Face упоминаются версии 0.1/0.2 (Aug/Sep) и 0.8 (последние дни на момент записи) schedule02:07

Интеграция: pip-пакет, голоса/эмбеддинги, ONNX. Поставка ориентирована на быстрый старт и переносимость.

  • Есть pip package
  • Можно загрузить все модели (включая quantized и non-quantized nano)
  • Формат моделей: ONNX
  • Есть NumPy-файл с голосами; автор предполагает, что это voice embeddings (по аналогии с Kokoro) schedule03:14

Качество/ограничения: артефакты, пунктуация, чувствительность голосов к 8-bit. Компромисс за размер — качество и стабильность.

  • На 8-bit nano заметны artifacts
  • Качество зависит от выбранного голоса: некоторые голоса «лучше работают на низком битрейте»
  • Проблема с паузами/пунктуацией: модель «не делает паузу» между предложениями ("tends to just keep going") schedule05:09

Gemini 3.1 Pro ставит рекорды — ИИ Новости

Для кого: CPO, Product Manager, Solo-Dev

Gemini 3.1 Pro: бенчмарки, домены силы и стоимость. Даны ориентиры, которые можно использовать для выбора базовой модели и прикидки бюджета inference.

  • Humanity’s Last Exam 2: 77% (Gemini 3.1 Pro) vs 68.8% (Opus 4.6)
  • По словам автора: Gemini 3.1 — лидер в 6 из 10 оценок ("artificial analysis")
  • Цена: $2 за 1M input tokens и $12 за 1M output tokens при контексте <200k tokens
  • «Стоимость запуска индекса интеллект» ~ $900: вдвое меньше, чем у Opus 4.6 и GPT 5? 2X H (как произнесено), но в 2 раза выше, чем у open-weights моделей вроде GLM 5 schedule00:51

Spellbook: быстрый запуск кастомного AI-ассистента с базой знаний + интеграции. Показан конкретный no/low-code флоу, как собрать ассистента и быстро довести до канала (Telegram/сайт).

  • Создать ассистента → задать параметры (имя/категория)
  • Включить функции: обработка Excel-отчётов и файлов (PDF/документы)
  • База знаний: создать новую базу → загрузить файлы разных форматов (ассистент будет ссылаться на них)
  • Добавить быстрые кнопки для частых вопросов (FAQ)
  • Интеграции: Telegram или встраивание на сайт (выдаётся код виджета)
  • Дополнительно упомянуто: маркетплейс готовых ассистентов; оплата картами; работа с картинками; промокод на 3 дня pro-тарифа (рекламная вставка) schedule03:19