Кейс разработки
SEO-движок — конвейер массовой генерации SEO-статей с картинками, валидацией и авто-проверкой уникальности текста
О проекте
SEO-движок — подсистема контент-платформы 1SELLER (работает в составе блога 1seller.ru). Превращает список ключевых запросов в готовые статьи с изображениями: текст пишет Claude, картинки рисует Gemini, результат проходит валидацию и проверку уникальности. Цель — рост органического трафика без ручного написания каждой статьи.
1. Задача
Контент-маркетингу нужен конвейер, а не ручное написание статей по одной:
- Массовая генерация статей по ключевым запросам.
- Изображения — автоматически, в тему статьи.
- Качество — структура и SEO-поля должны соответствовать схеме, иначе авто-починка.
- Уникальность — контроль против выдачи поисковиков до публикации.
2. Архитектура решения
Stateful-конвейер: каждая статья проходит через детерминированную цепочку статусов от постановки в очередь до публикации.
| Параметр | Значение |
|---|---|
| Текст | Anthropic (Claude) |
| Изображения | Gemini |
| Валидация | Zod-схемы + до 2 авто-починок (repair) |
| Хранилище | Supabase (PostgreSQL): кампании, задания по ключам, медиа |
| Доступ к AI | через SOCKS-прокси |
Пайплайн на ключ: queued → preparing → writing → validating → [repairing] → seo → images → assembling → saving → draft/published.
3. Главная инженерная сложность
Две нетривиальные части — надёжность многошагового конвейера и честная проверка уникальности.
| Узел | Решение |
|---|---|
| Надёжность пайплайна | Явные статусы каждого шага + Zod-валидация + до 2 авто-починок при несоответствии схеме |
| Проверка уникальности | Word-шинглы (5-граммы, FNV-1a) → источники (Yandex Search / Google CSE / Bing) → фетч страниц (Readability, кэш 7 дней) → overlap → процент уникальности |
| Управление | API кампаний и заданий: запуск, статус, повтор, публикация, регенерация SEO/картинок |
Результат
Статьи под ключевые запросы генерируются, иллюстрируются и проверяются на уникальность пакетами — контент-маркетинг переведён с ручного написания на управляемый конвейер.
4. Эффект для бизнеса
- Объём контента — статьи выпускаются пакетами по ключам.
- Контроль качества — валидация структуры и проверка уникальности до публикации.
- Управляемость — кампании запускаются и перезапускаются через API.
5. Технологический стек — кратко
| Параметр | Значение |
|---|---|
| AI | Claude (текст) + Gemini (изображения) |
| Валидация | Zod + авто-починка |
| Хранилище | Supabase (PostgreSQL) |
| Уникальность | шинглы FNV-1a + Yandex / Google CSE / Bing |
Кейс подготовлен на основе технической архитектуры SEO-движка в составе блога 1seller (ООО «Первый Селлер»). Описывается инженерное решение.