Соло-разработка с ИИ

В соло-разработке с ИИ вы делаете работу втроём: вы, AI-ассистент в IDE и автономные агенты, которые что-то перебирают, пока вы переключаетесь на другую задачу. У такого режима появляется свой набор «слепых зон»:

Долгие автономные задачи — агент полчаса разбирается с миграцией БД, и не хочется проверять терминал каждые 30 секунд.
Внешние зависимости — LLM API, vector-БД, embeddings-сервис: их статус меняется без предупреждения, а у вас нет SRE-команды.
Стоимость — токенов сжигается много, easy потерять контроль над счётом.
Качество модели — релиз новой версии модели может сломать ваш пайплайн ровно ночью.
MCP-инструменты — если ваш AI ходит в свой MCP-сервер, его падение выглядит как «модель тупит», а не как алёрт.

Notifly закрывает всё это в несколько строк: heartbeat-ы, активные мониторы, веб-хуки и собственные cloud-функции для синтетических проверок шлют push в ваше устройство ровно тогда, когда нужно вмешаться.

Готовые рецепты

Сценарий	Что закрывает
Расходы на LLM API	Превышение бюджета на токенах
Доступность LLM-провайдеров	OpenAI/Anthropic/etc. не отвечают, 5xx, rate limits
Деградация latency моделей	Внезапное «модель стала медленнее»
Завершение долгой задачи AI-агента	«Агент закончил рефакторинг — иди ревьюить»
Зависший агент / loop	Heartbeat-защита от тихих зависаний
Нужен human-in-the-loop	Агент поставил задачу на паузу — нужен ваш approve
Vector DB / RAG-инфраструктура	Qdrant/Pinecone/Weaviate легли
Просадка eval / качества модели	Регрессия после смены промпта или модели
Сработал safety / prompt injection	Подозрительный пользовательский ввод
Здоровье MCP-сервера	Свой/сторонний MCP перестал отвечать
Своя cloud-функция integrity-проверки	Серверный «синтетический пользователь», который шлёт алёрт при поломке

Дополнительные рецепты

Стоимость и квоты

Доступность и latency

AI-агенты

Качество ответов

RAG и данные

Безопасность

Инфраструктура и разработка

Личное

Почему именно push, а не email

LLM-инциденты часто короткие и шумные: 10 минут 500-х → починилось. Email-алёрты приходят пачками с задержкой и тонут в почте; push-уведомление на телефон через Notifly — мгновенное, бесплатное и его легко молча дисмиссить, если вы видите, что инцидент уже прошёл сам.

Все рецепты в этом разделе используют один и тот же базовый стек:

POST /message — ad-hoc алёрты из кода;
Heartbeat — «агент жив»;
Активные мониторы — внешние HTTP/TCP/TLS-проверки;
Вебхуки — приём событий из биллинга/CI;
Email Inbox — алёрты от провайдеров, у которых нет webhooks;
собственные cloud-функции на YC — для своих проверок.