Что это
Данный проект представляет собой специализированный шаблон (проект) для программы Content Downloader, предназначенный для автоматизированного парсинга данных о товарах и отзывах с торговой площадки AliExpress. Решение ориентировано на пользователей, которым необходимо выгружать структурированную информацию для последующего импорта в интернет-магазины на базе OpenCart.
Основной функционал
Проект обеспечивает автоматизацию сбора данных по двум основным направлениям:
- Парсинг отзывов: сбор ID товара, имени покупателя, текста и рейтинга отзыва, даты и времени, а также автоматическое сохранение всех изображений, прикрепленных покупателями, в отдельную папку.
- Парсинг характеристик товара: сбор ID, названия, рейтинга, количества заказов, стоимости, валюты, остатков на складе, сроков доставки и обработки заказа, данных о продавце, а также мета-тегов (title, keywords, description) и информации о добавлении в список желаний.
- Работа с каталогом: возможность поиска по ключевым словам, сортировка по количеству заказов и автоматический переход по страницам выдачи для сбора ссылок на товары.
- Гибкая настройка изображений: поддержка двух шаблонов именования файлов (на основе названия товара или ID товара) с сохранением оригинальных изображений продукта.
- Оптимизация процесса: наличие системы проверки уже спарсенных отзывов для исключения дублей, возможность фильтрации отзывов (только с текстом или фото), а также функция возобновления работы с последнего обработанного товара при возникновении ошибок.
- Отчетность: формирование итоговых отчетов о количестве обработанных ссылок и статусе выполнения задачи.
Что вы получаете
Покупатель получает готовый проект для Content Downloader, настроенный согласно техническому заданию для работы с динамическим контентом AliExpress. В комплект входят настройки для выгрузки данных в Excel-файлы с заданными форматами ячеек и логикой именования медиафайлов. Дополнительные технические детали и специфические параметры конфигурации соответствуют описанному функционалу парсинга.