...
при этом нужно открыть полный текст страницы и проверить, что такой текст встречается только в одном месте, или же встречается первым на странице для нужного для парсинга блока.
Конец блока ссылок - текст, которым заканчивается блок с ссылками, его можно оставить пустым, в этом случае извлечение ссылок на группы товаров будет из всего текста до конца страницы, начиная с текста “Начало блока ссылок”
Начало блока 1 ссылки - текст HTML, начиная с которого начинается блок одной ссылки
...
Конец блока 1 ссылки - текст, которым заканчивается блок одной ссылки
Note |
---|
Важно чтобы текст начала и конца встречался только в начале и в конце блока, в котором содержится название группы товаров и ссылка на нее. Нельзя чтобы этот текст встречался еще внутри блока. |
При наведении на нужный блок можно нажать Edit as HTML, чтобы увидеть текст всего блока и, по возможности, из этого текста выбрать начало и конец.
...
Дальше идут настройки получения названия группы и ссылки на нее. Для получения этих значений можно сначала определить блок, в рамках которого парсер будет искать нужный текст, а затем уже сами значения. Если не определен блок для ссылки или названия, то ссылка или название ищется в рамках всего блока для 1 ссылки.
...
В примере для названия группы сразу отделяется блок, который начинается с тегов “Блок от” и “Блок до”, а затем уже выделяется название, которое находится между текстом > и < в пределах полученного блока текста.
В примере для ссылки используется весь блок текста для 1 ссылки, из которого выделяется текст между тегами href=” и “