Соло-разработка с ИИ
В соло-разработке с ИИ вы делаете работу втроём: вы, AI-ассистент в IDE и автономные агенты, которые что-то перебирают, пока вы переключаетесь на другую задачу. У такого режима появляется свой набор «слепых зон»:
- Долгие автономные задачи — агент полчаса разбирается с миграцией БД, и не хочется проверять терминал каждые 30 секунд.
- Внешние зависимости — LLM API, vector-БД, embeddings-сервис: их статус меняется без предупреждения, а у вас нет SRE-команды.
- Стоимость — токенов сжигается много, easy потерять контроль над счётом.
- Качество модели — релиз новой версии модели может сломать ваш пайплайн ровно ночью.
- MCP-инструменты — если ваш AI ходит в свой MCP-сервер, его падение выглядит как «модель тупит», а не как алёрт.
Notifly закрывает всё это в несколько строк: heartbeat-ы, активные мониторы, веб-хуки и собственные cloud-функции для синтетических проверок шлют push в ваше устройство ровно тогда, когда нужно вмешаться.
Готовые рецепты
Заголовок раздела «Готовые рецепты»| Сценарий | Что закрывает |
|---|---|
| Расходы на LLM API | Превышение бюджета на токенах |
| Доступность LLM-провайдеров | OpenAI/Anthropic/etc. не отвечают, 5xx, rate limits |
| Деградация latency моделей | Внезапное «модель стала медленнее» |
| Завершение долгой задачи AI-агента | «Агент закончил рефакторинг — иди ревьюить» |
| Зависший агент / loop | Heartbeat-защита от тихих зависаний |
| Нужен human-in-the-loop | Агент поставил задачу на паузу — нужен ваш approve |
| Vector DB / RAG-инфраструктура | Qdrant/Pinecone/Weaviate легли |
| Просадка eval / качества модели | Регрессия после смены промпта или модели |
| Сработал safety / prompt injection | Подозрительный пользовательский ввод |
| Здоровье MCP-сервера | Свой/сторонний MCP перестал отвечать |
| Своя cloud-функция integrity-проверки | Серверный «синтетический пользователь», который шлёт алёрт при поломке |
Дополнительные рецепты
Заголовок раздела «Дополнительные рецепты»Стоимость и квоты
Заголовок раздела «Стоимость и квоты»- Token-квоты модели
- Стоимость одного запроса
- Квоты voice API (TTS / STT)
- Расходы на инфраструктуру (YC / AWS)
Доступность и latency
Заголовок раздела «Доступность и latency»AI-агенты
Заголовок раздела «AI-агенты»Качество ответов
Заголовок раздела «Качество ответов»- Всплеск галлюцинаций
- Thumbs-down от пользователя
- Падение hit-rate prompt-cache
- Дрейф данных в датасете
- Fine-tune завершён
RAG и данные
Заголовок раздела «RAG и данные»Безопасность
Заголовок раздела «Безопасность»- Секреты в логах LLM
- Новая CVE в зависимостях
- Модерация при генерации картинок
- Истечение API-ключей и лицензий
Инфраструктура и разработка
Заголовок раздела «Инфраструктура и разработка»- AI делает PR-review
- Flaky-тесты найдены
- Ошибки в канарейке деплоя
- Прогресс долгой миграции БД
- Шторм вебхук-ретраев
- Утечка памяти в serverless
- Crash мобильного клиента
Почему именно push, а не email
Заголовок раздела «Почему именно push, а не email»LLM-инциденты часто короткие и шумные: 10 минут 500-х → починилось. Email-алёрты приходят пачками с задержкой и тонут в почте; push-уведомление на телефон через Notifly — мгновенное, бесплатное и его легко молча дисмиссить, если вы видите, что инцидент уже прошёл сам.
Все рецепты в этом разделе используют один и тот же базовый стек:
POST /message— ad-hoc алёрты из кода;- Heartbeat — «агент жив»;
- Активные мониторы — внешние HTTP/TCP/TLS-проверки;
- Вебхуки — приём событий из биллинга/CI;
- Email Inbox — алёрты от провайдеров, у которых нет webhooks;
- собственные cloud-функции на YC — для своих проверок.