Что это
SelfParser — это универсальный программный инструмент для автоматического сбора (парсинга) новостей и товарных позиций с различных веб-ресурсов. Программа представляет собой независимое решение, которое не требует подключения к базе данных для своей работы, обеспечивая гибкость в обработке и сохранении полученной информации.
Основной функционал
- Независимая архитектура: Программа работает автономно, независимо от используемой на сайте CMS.
- Гибкая настройка шаблонов: Возможность создания неограниченного количества шаблонов для парсинга различных сайтов-доноров.
- Обработка данных: Поддержка кодировок UTF-8 и windows-1251 с автоматической конвертацией. Возможность парсинга контента как с сохранением HTML-тегов, так и без них.
- Управление контентом: Инструменты для удаления ненужных элементов, скриптов, а также замены или вырезания фраз и кода с использованием регулярных выражений.
- Работа с медиа: Автоматическое скачивание картинок и файлов на сервер с заменой путей в контенте.
- Интеграция с DLE: В комплект входит готовый обработчик для DataLife Engine, который поддерживает сохранение данных в дополнительные поля, распределение по категориям и публикацию постов (сразу или на модерацию).
- Автоматизация: Поддержка работы по крону через HTTP-запросы, ведение логов, проверка активности шаблонов и использование прокси SOCKS5.
- Контроль дублей: Система сверки по заголовкам для предотвращения повторной публикации уже имеющихся материалов.
Что вы получаете
Покупатель получает программный пакет, включающий адаптивную панель управления для настройки шаблонов и процессов парсинга. В комплект поставки входит готовый обработчик для CMS DLE, позволяющий сразу приступить к наполнению сайта. Пользователь получает возможность самостоятельно расширять функционал за счет написания собственных обработчиков на PHP. Программа поддерживает проверку работы шаблонов в режиме реального времени и обеспечивает стабильную работу при запуске по крону.