Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Данный парсер настраивается в случае, когда вам нужно собрать с сайта-источника ссылки на группы товаров, для последующего парсинга товаров из этих групп.

...

При наведении на нужный блок можно нажать Edit as HTML, чтобы увидеть текст всего блока и, по возможности, из этого текста выбрать начало и конец.

...

Image RemovedImage Added

Дальше идут настройки получения названия группы и ссылки на нее. Для получения этих значений можно сначала определить блок, в рамках которого парсер будет искать нужный текст, а затем уже сами значения. Если не определен блок для ссылки или названия, то ссылка или название ищется в рамках всего блока для 1 ссылки.

...

Добавить в конец URL - здесь указывается текст, который будет добавлен в конец ссылки, чтобы получилась ссылка для перемещения между страницами группы товаров. Т.е. например, при переходе на третью страницу, ссылка сайта выглядит как https://site.ru/instrument/page3/ - в этом случае в конец https://site.ru/instrument/ нужно добавить текст page3/ , а чтобы программа прошла все ссылки, то нужно номер страницы заменить на {N} - вместо этого значения программа будет подставлять номер страницы, при работе парсера по группам товаров.

...

Бывают случаи, когда для страниц в категории есть страницы https://site.ru/instrument/page3/, https://site.ru/instrument/page4/ и т.д., но нет страницы https://site.ru/instrument/page1/ , т.е. самой первой страницы группы товаров, вместо нее возможен переход только на страницу https://site.ru/instrument/ - в таком случае нужно поставить птичку “Дублировать ссылку без добавления в конец текста” и указать номер страницы, с которой будет начинать работать ссылка перехода по страницам, т.е. в которой есть тег {N}

...

В результате работы парсера будут получены ссылки на группы товаров, которые можно использовать для парсера товаров по категориям.

...

.

...

Для проверки настроек парсера можно использовать кнопку Тест. Будет произведен парсинг страницы по ссылке, введенной рядом, результаты будут отображены в виде текстовой информации.

...

Если все ок, должны быть видны строки “добавлено”

...

Если поставить птичку Fiddler, то при тесте будет использоваться эта программа.