Данный парсер настраивается в случае, когда вам нужно собрать с сайта-источника ссылки на группы товаров, для последующего парсинга товаров из этих групп.
...
При наведении на нужный блок можно нажать Edit as HTML, чтобы увидеть текст всего блока и, по возможности, из этого текста выбрать начало и конец.
...
Дальше идут настройки получения названия группы и ссылки на нее. Для получения этих значений можно сначала определить блок, в рамках которого парсер будет искать нужный текст, а затем уже сами значения. Если не определен блок для ссылки или названия, то ссылка или название ищется в рамках всего блока для 1 ссылки.
...
В примере для ссылки используется весь блок текста для 1 ссылки, из которого выделяется текст между тегами href=” и “
...
Добавить в начало URL - текст, который добавляется к тексту ссылки, полученному предыдущими настройками. Т.е. на странице товара может быть только часть ссылки, без указания домена сайта, например, “/instrument/” , а чтобы программа перешла по этой ссылке нужно добавить и сам домен, чтобы получилось, например, https://site.ru/instrument/ , т.е. добавить в начало текста ссылки “https://site.ru”
Добавить в конец URL - здесь указывается текст, который будет добавлен в конец ссылки, чтобы получилась ссылка для перемещения между страницами группы товаров. Т.е. например, при переходе на третью страницу, ссылка сайта выглядит как https://site.ru/instrument/page3/ - в этом случае в конец https://site.ru/instrument/ нужно добавить текст page3/ , а чтобы программа прошла все ссылки, то нужно номер страницы заменить на {N} - вместо этого значения программа будет подставлять номер страницы, при работе парсера по группам товаров.
Бывают случаи, когда для страниц в категории есть страницы https://site.ru/instrument/page3/, https://site.ru/instrument/page4/ и т.д., но нет страницы https://site.ru/instrument/page1/ , т.е. самой первой страницы группы товаров, вместо нее возможен переход только на страницу https://site.ru/instrument/ - в таком случае нужно поставить птичку “Дублировать ссылку без добавления в конец текста” и указать номер страницы, с которой будет начинать работать ссылка перехода по страницам, т.е. в которой есть тег {N}
...
Страницы поиска - здесь указывается список ссылок на страницы, с которых будут парсить ссылки на группы, т.е., как правило, это список ссылок на вышестоящие группы, которые находятся на уровень выше, чем группы товаров, список которых нужно получить. Каждая ссылка указывается с новой строки.
...