Quad.Wiki

Skip to end of metadata
Go to start of metadata

You are viewing an old version of this page. View the current version.

Compare with Current View Page History

Version 1 Next »

Данный парсер применяется для того, чтобы собрать список товаров, или же в случае, когда с сайта нужно собирать только цены и наличие товаров. В этом случае парсеру не нужно заходить в каждую карточку товара, а достаточно собрать информацию из группы, на одной странице которой может отображаться сразу 20 или больше товаров, соответственно скорость сбора информации будет в разы выше. Пример страницы категории, на которой отображаются сразу несколько товаров:

Настройка парсера осуществляется во вкладке Настройки / Категории

Сначала нужно добавить список ссылок на категории, которые будут парситься. Это можно сделать как вручную Настройка групп товаров для парсинга , так и с помощью парсера ссылок на группы Парсер ссылок на группы товаров

Настройки парсера

Перейдите во вкладку “Настройки”

1. Нужно указать блок, в котором находится список товаров, для этого указываются теги начала и конца блока

Пример:

2. Указать блок в котором содержится 1 товар из группы

Будьте внимательны, часто первый товар в группе или последний может быть ограничен разными тегами

Не обязательно чтобы блок точно “вырезал” текст HTML связанный с одним товаром от начала до конца. Достаточно вырезать только ту часть, в которой есть нужная вам информация.

При этом нужно обязательно проверить, чтобы вырезался именно блок товара и эти теги не использовались где-то в другом месте.

Проверять можно путем подсчета количества текста, который вводим в настройку начала блока, на странице. Для этого исходный текст страницы можно вставить в программу Notepad++, открыть там поиск, ввести текст и нажать “Подсчитать”

В моем примере найдено 40 совпадений, при этом на странице отображается 40 товаров, значит все ок. Если бы совпадений было больше или меньше, то нужно было бы разбираться, почему так, и использовать другие теги.

  • No labels