Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Данный парсер настраивается в случае, когда вам нужно собрать с сайта-источника ссылки на группы товаров, для последующего парсинга товаров из этих групп.

Парсер применяется в случае, когда этих групп много и нельзя их добавить вручную. Нужно сначала попытаться найти на этом сайте какую-то ссылку, по которой бы отображались все товары. Например “Каталог” - в этом случае нужно будет для парсера товаров по группам указать только одну ссылку, а не отдельно ссылки на каждую группу.

Чтобы парсер выполнялся, в его настройках должна стоять такая птичка:

...

Warning

Выполняйте тесты, как описано в конце инструкции, чтобы убедиться, что результаты получены парсером правильно, прежде чем запускать парсер.

Пример задачи

Нужно спарсить только 2 раздела с сайта

...

Добавить в конец URL - здесь указывается текст, который будет добавлен в конец ссылки, чтобы получилась ссылка для перемещения между страницами группы товаров. Т.е. например, при переходе на третью страницу, ссылка сайта выглядит как https://site.ru/instrument/page3/ - в этом случае в конец https://site.ru/instrument/ нужно добавить текст page3/ , а чтобы программа прошла все ссылки, то нужно номер страницы заменить на {N} - вместо этого значения программа будет подставлять номер страницы, при работе парсера по группам товаров.

...

Бывают случаи, когда для страниц в категории есть страницы https://site.ru/instrument/page3/, https://site.ru/instrument/page4/ и т.д., но нет страницы https://site.ru/instrument/page1/ , т.е. самой первой страницы группы товаров, вместо нее возможен переход только на страницу https://site.ru/instrument/ - в таком случае нужно поставить птичку “Дублировать ссылку без добавления в конец текста” и указать номер страницы, с которой будет начинать работать ссылка перехода по страницам, т.е. в которой есть тег {N}

...

Для проверки настроек парсера можно использовать кнопку Тест. Будет произведен парсинг страницы по ссылке, введенной рядом (или нескольким ссылкам), результаты будут отображены в виде текстовой информации.

...