Содержание
Как создать ИИ-агента — пошаговое руководство | AIBot.Direct
Обзор подходов к созданию ИИ-агента
Существует два основных пути создания ИИ-агента:
Code-подход
Программирование на Python/JavaScript с использованием фреймворков.
Плюсы:- Максимальная гибкость
- Полный контроль над логикой
- Легко масштабировать
- Требует навыков программирования
- Больше времени на разработку
No-code подход
Визуальные конструкторы типа n8n для быстрого создания агентов.
Плюсы:- Быстрый старт (часы вместо дней)
- Не нужно программирование
- Визуальная отладка
- Ограничения сложной логики
- Зависимость от платформы
Наша рекомендация
Для большинства бизнес-задач рекомендуем n8n — оптимальный баланс между гибкостью и простотой. Если нужна сложная логика или высокие нагрузки — переходите на code-подход с LangChain.
Шаг 1: Определение задач агента
Прежде чем писать код или настраивать n8n, чётко сформулируйте:
Вопросы для определения задач
- Какую проблему решает агент? — Например: "Автоматическая квалификация входящих лидов"
- Кто будет взаимодействовать с агентом? — Клиенты, сотрудники, партнёры
- Через какие каналы? — Telegram, WhatsApp, сайт, API
- Какие действия должен выполнять? — Отвечать на вопросы, создавать записи, отправлять уведомления
- С какими системами интегрировать? — CRM, базы данных, календари
Пример описания агента
Агент: Ассистент по продажам недвижимости
Задачи:
- Отвечать на вопросы клиентов в Telegram
- Квалифицировать по бюджету, локации, типу недвижимости
- Подбирать объекты из базы данных
- Записывать на просмотры
- Создавать сделки в Bitrix24
Интеграции: Telegram, PostgreSQL (база объектов), Bitrix24, Google Calendar
Шаг 2: Выбор LLM (языковой модели)
LLM — это "мозг" агента. Выбор зависит от задач, бюджета и требований к приватности.
GPT-5.1 (OpenAI)
400K контекст, отличный function calling, мультимодальность. Работает до 24 часов автономно.
Claude Opus 4.5
80.9% SWE-bench, лидер в кодинге. Параметр effort для контроля качества/скорости.
Gemini 3 Pro
Лидер в мультимодальных и научных задачах. Отличная визуальная обработка.
Grok 4 (xAI)
2M токенов контекст, доступ к данным X в реальном времени. Быстрый inference.
Как выбрать модель?
- Нужна максимальная приватность? → Ollama + Llama 4
- Важен баланс цена/качество? → GPT-5.1 или Claude Sonnet 4.5
- Работа с большими документами? → Grok 4 (2M контекст)
- Минимальный бюджет? → Gemini 3 Flash или Groq (бесплатный tier)
Шаг 3: Настройка инструментов (Tools)
Инструменты позволяют агенту взаимодействовать с внешним миром. Без них агент — просто чат-бот.
Типы инструментов
- Web Search (Google, Bing)
- Wikipedia
- Vector Store (RAG)
- SQL-запросы к БД
- Google Sheets
- REST API
- Отправка email
- Telegram/WhatsApp
- Slack/Discord
- CRM (создание сделок)
- Календарь (бронирование)
- Helpdesk (тикеты)
Пример описания инструмента
from langchain.tools import tool
from pydantic import BaseModel, Field
class SearchPropertiesInput(BaseModel):
city: str = Field(description="Город для поиска")
max_price: int = Field(description="Максимальная цена в рублях")
rooms: int = Field(description="Количество комнат", default=None)
@tool("search_properties", args_schema=SearchPropertiesInput)
def search_properties(city: str, max_price: int, rooms: int = None):
"""Поиск объектов недвижимости по параметрам.
Используй этот инструмент когда клиент спрашивает о
доступных квартирах или хочет подобрать объект."""
# Запрос к базе данных
query = f"""
SELECT * FROM properties
WHERE city = '{city}'
AND price <= {max_price}
{f"AND rooms = {rooms}" if rooms else ""}
LIMIT 5
"""
results = db.execute(query)
return format_properties(results)
Важно: описание инструмента
LLM решает, какой инструмент вызвать, на основе описания (docstring). Пишите чёткие описания: когда использовать, какие параметры, что возвращает. Плохое описание = агент не вызывает инструмент или вызывает не тот.
Шаг 4: Создание System Prompt
System Prompt — инструкции для агента. Это самая важная часть, определяющая поведение.
Структура хорошего промпта
- Роль и контекст — кто агент, для какой компании работает
- Цели — что должен достигать
- Правила поведения — что можно и нельзя делать
- Инструкции по инструментам — когда какой использовать
- Формат ответов — длина, стиль, структура
- Примеры — few-shot для сложных случаев
Шаблон System Prompt
# РОЛЬ
Ты — ИИ-ассистент компании "Премиум Риэлт", специализирующейся
на продаже квартир в Москве. Твоё имя — Алиса.
# ЦЕЛИ
1. Помогать клиентам найти подходящую недвижимость
2. Квалифицировать клиентов по бюджету и потребностям
3. Записывать заинтересованных клиентов на просмотры
4. Создавать сделки в CRM для менеджеров
# ПРАВИЛА ПОВЕДЕНИЯ
- Всегда начинай с приветствия и уточняющих вопросов
- Отвечай кратко, 2-3 предложения максимум
- Если не знаешь ответ — честно скажи и предложи связаться с менеджером
- НИКОГДА не называй конкретные цены без проверки в базе
- При агрессии — сохраняй спокойствие, предложи связаться с руководством
# ИСПОЛЬЗОВАНИЕ ИНСТРУМЕНТОВ
- search_properties: когда клиент называет бюджет/район/параметры
- schedule_viewing: когда клиент хочет посмотреть объект
- create_deal: после успешной записи на просмотр
# ФОРМАТ ОТВЕТОВ
- Русский язык
- Вежливый, но не слащавый тон
- Эмодзи — минимально, только если уместно
- Структурируй списки, если перечисляешь объекты
# ПРИМЕР ДИАЛОГА
Клиент: Ищу двушку до 15 млн
Агент: Понял! Подскажите, какой район Москвы рассматриваете?
И важна ли близость к метро?
Шаг 5: Добавление памяти
Память позволяет агенту помнить контекст разговора и информацию о пользователе.
Типы памяти
Хранит всю историю диалога. Простая, но потребляет много токенов при длинных разговорах.
Для коротких сессийХранит последние N сообщений. Баланс между контекстом и расходом токенов.
Рекомендуется для большинстваСжимает историю в резюме. Экономит токены, но теряет детали.
Для очень длинных сессийХранит в векторной БД, извлекает релевантное. Для долгосрочной памяти о пользователе.
Для персонализацииРеализация в Python
from langchain.memory import ConversationBufferWindowMemory
from langchain_community.chat_message_histories import RedisChatMessageHistory
# Хранение в Redis для персистентности
def get_memory(session_id: str):
message_history = RedisChatMessageHistory(
session_id=session_id,
url="redis://localhost:6379"
)
return ConversationBufferWindowMemory(
memory_key="chat_history",
chat_memory=message_history,
k=10, # Последние 10 сообщений
return_messages=True
)
# Использование
memory = get_memory(user_id="telegram_12345")
agent = create_agent(llm=llm, tools=tools, memory=memory)
Шаг 6: Тестирование и деплой
Чеклист тестирования
Варианты деплоя
No-code решение на n8n
Если не хотите программировать, n8n позволяет создать агента визуально:
Преимущества n8n для агентов
- Визуальный редактор workflow
- Встроенные AI-ноды (Agent, Memory, Tools)
- 400+ интеграций из коробки
- Self-hosted — полная приватность
- Бесплатный open-source
Базовый агент в n8n
Получение сообщения
+ Chat Model
+ Memory
+ Tools
Отправка ответа
Хотите создать агента на n8n?
Подробное руководство по n8n AI Agent →Часто задаваемые вопросы
Частые вопросы
Выберите одну конкретную повторяющуюся задачу с чёткими входами и выходами. Не «помогать клиентам» — а «отвечать на вопросы о доставке». Затем выберите инструмент: для начала рекомендуется n8n.
Для коротких сессий — Buffer Memory (вся история). Для большинства задач — Window Memory (последние 10 сообщений). Для очень длинных — Summary Memory. Для персонализации — Vector Memory в Qdrant или pgvector.
Инструкции для агента: роль и контекст компании, цели, правила поведения, когда использовать инструменты, формат ответов и примеры (few-shot). Это самая важная часть — плохой промпт не исправить хорошим кодом.
n8n self-hosted: VPS от 1 000 руб/мес на Hetzner или Selectel. OpenAI API: ~3 000-8 000 руб/мес при 500 диалогов/день. Итого операционные расходы: от 4 000 до 10 000 руб/мес на старте.
n8n: визуальный редактор, быстрый старт (часы вместо дней), 400+ интеграций, не нужно программирование для базовых агентов. Python + LangChain: максимальная гибкость, полный контроль, легко масштабировать, но нужны навыки разработки.
Чеклист: базовые сценарии (happy path), edge cases (пустой ввод, длинные сообщения), провокации и попытки jailbreak, обработка ошибок API, корректность вызова инструментов, время отклика менее 5 секунд.
Нужна ИИ-автоматизация под ваш бизнес?
Запишитесь на бесплатную консультацию — обсудим задачу и пришлём готовое решение.
Обсудить проект →