...
Товар с модификациями - товары на сайте-источнике, в карточке которых можно выбрать цвет, размер и другие параметры, в зависимости от которых может менять цена, наличие, описание и фото товаров. При этом нет отдельной ссылки на конкретную модификацию товара, с заданными параметрами. Если есть отличающаяся ссылка на каждую модификацию, то это можно считать как обычный товар.
Proxy - прокси-сервер (https://ru.wikipedia.org/wiki/Прокси-сервер) , простыми словами, это специальные сервера в сети интернет, которые используются для скрытия вашего IP-адреса, чтобы владельцы сайтов-источников не могли вас заблокировать. Они, как правило, платные. Можно найти и бесплатные, но в 99% случаев они очень медленные или работают всего пару часов. Если парсить планируете много и разных сайтов, вам нужно купить пакет из 1000+ прокси, страна прокси желательно РФ, если планируете парсинг белорусских или российских сайтов. Или Украина, если нужно парсить украинские сайты.
Можно так же купить пакеты индивидуальных Прокси (которые выделяются только вам, они работают быстрее), если не собираетесь парсить какие-то крупные сайты с серьезной защитой от парсинга. Индивидуальных прокси достаточно 10-20 штук.
Виды парсеров
Модуль универсального парсинга, встроенный в программу, позволяет парсить “обычные” сайты интернет-магазинов, которые реализованы в “общепринятом” виде. Т.е. где есть группы товаров и отдельные карточки товаров, которые можно открыть по ссылке, при этом не может быть одинаковой ссылки на разные товары. Универсальным парсером нельзя спарсить товары, которые имеют модификации, при этом на модификацию товара нет отдельной ссылки. Чтобы спарсить такие сайты нужен будет программист.
...
Так же такой парсер настраивается, если необходимо собрать ссылки на товары, по которым затем будет запущен парсер по ссылкам и получена уже информация из карточек товаров.
Парсер информации из групп товаров
3. Парсер ссылок на группы
...
Или подгрупп не много, но они могут периодически добавляться на сайте источнике и нужно их отслеживать автоматически, чтобы потом не добавлять вручную.
Парсер ссылок на группы товаров
4. Парсер ссылок через поиск товара
Парсер применяется в случае, если вы не хотите парсить целиком все товары на сайте-источнике, а только те товары, которые продаете. При этом у вас должен быть загружен прайс поставщика, содержащий какие-то названия или коды, при вводе которых в поле поиска на сайте поставщика в результатах отображается единственно верный товар. Или же в вашем собственном товаре должен быть какой-то артикул, по которому можно найти товар на сайте поставщика.
Парсер ссылок через поиск на сайте
Какой парсер выбрать?
Выбирать парсер нужно по следующим условиям:в зависимости от того, каким способом вы можете получить товары с сайта-источника, а так же от количества товаров. Если у вас нет возможности получить файл с ссылками на сайт, откуда нужно парсить, то помимо парсера описаний вам нужно будет настроить еще и парсер ссылок.
Парсер цен
Для парсера цен нужно, по возможности, делать парсер по группам. Так как, например, в группе отображаться может 20 товаров и вы будете собирать цены в 20 раз быстрее, чем если парсер будет заходить в каждую карточку товара.
Если парсер по группам невозможно сделать по каким-то причинам (не все цены видны в группе, или не отображается количество товаров в группе), то нужно делать парсер по ссылкам, заходящий в каждую карточку товара, но при этом стараться минимизировать количество товаров, цены на которые будут собираться. Т.е. не нужно собирать цены на те товары, которые вам не нужны, если это возможно. Т.е. нужно собрать только те ссылки, цены которые нужны, при помощи парсера по группам товаров или парсера, использующего поиск на сайте источнике по названию или по коду.
Парсер описаний
Для парсера описаний используется парсер по ссылкам на карточки товаров, но опять же, количество карточек нужно минимизировать. Если на сайте источнике больше 20 000 товаров и при этом вам нужна только часть товаров, то нужно сначала отобрать группы для парсинга и парсером по группам собрать ссылки на товары.
...
Если вам нужна только часть товаров с сайта, но при этом вы парсите весь сайт, “про запас”, то нужно понимать, что на сайте-источнике со временем могут исправляться характеристики, добавляться в карточку товара новые, более качественные, фото, дополняться описания, и если вы какие-то товары будете добавлять только через месяц, то вам все равно придется заново парсить сайт, чтобы получить актуальную информацию.