Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

при этом нужно открыть полный текст страницы и проверить, что такой текст встречается только в одном месте, или же встречается первым на странице для нужного для парсинга блока.

Конец блока ссылок - текст, которым заканчивается блок с ссылками, его можно оставить пустым, в этом случае извлечение ссылок на группы товаров будет из всего текста до конца страницы, начиная с текста “Начало блока ссылок”

Начало блока 1 ссылки - текст HTML, начиная с которого начинается блок одной ссылки

...

Конец блока 1 ссылки - текст, которым заканчивается блок одной ссылки

Note

Важно чтобы текст начала и конца встречался только в начале и в конце блока, в котором содержится название группы товаров и ссылка на нее. Нельзя чтобы этот текст встречался еще внутри блока.

При наведении на нужный блок можно нажать Edit as HTML, чтобы увидеть текст всего блока и, по возможности, из этого текста выбрать начало и конец.

...

Image Added

Дальше идут настройки получения названия группы и ссылки на нее. Для получения этих значений можно сначала определить блок, в рамках которого парсер будет искать нужный текст, а затем уже сами значения. Если не определен блок для ссылки или названия, то ссылка или название ищется в рамках всего блока для 1 ссылки.

...

В примере для названия группы сразу отделяется блок, который начинается с тегов “Блок от” и “Блок до”, а затем уже выделяется название, которое находится между текстом > и < в пределах полученного блока текста.

В примере для ссылки используется весь блок текста для 1 ссылки, из которого выделяется текст между тегами href=” и