Table of Contents |
---|
...
После знака | нужно добавить код из текста страницы, который однозначно означает, что товар находится в требуемом наличии, указанном с помощью ИД перед знаком |
1|button>Купить
3|button>Заказать
Если указанного варианта текста не найдено на странице, то товар станет Нет в наличии
Можно наоборот, задать только текст для нет в наличии, например
2|class=”NotAvailable”
В этом случае, если найдет такой текст, то товар будет Нет в наличии, если не найден - в наличии.
...
N - в этой колонке указывается порядок, в котором собирается информация с сайта. Порядок нужен для случая, когда в одно поле нужно собирать информацию из нескольких блоков, или если какая-то информация может быть в разных карточках в разных местах, чтобы проверить все возможные варианты. Указывайте порядок с интервалом 10, чтобы при необходимости можно было вставить поле без перенумерации.
Код поля для сохранения информации
Поле - здесь указывается код поля, в который будет сохранена информация.
Стандартные поля:
code - код товара
title - название товара
article - модель товара
manuf - бренд / производитель
category - группа товара (нельзя использовать для Основного прайса)
price - цена
price_curr_id - ИД валюты для цены
fixed_price - рекомендованная цена (нельзя использовать для Основного прайса)
fix_price_curr_id - ИД валюты для рекомендованной цены цены (нельзя использовать для Основного прайса)
Код пользовательских полей можно посмотреть здесь:
...
Помимо кода поля можно указать специальные теги:
X-CSRF-Token - если указан данный тег в качестве поля, то информация для этого поля, полученная парсером, будет сохранена и передана в следующий запрос. Используется в случае, если для получения информации на странице используется AJAX, т.е. какие-то подзапросы, в которые нужно передавать специальный “токен”. Не используйте это, если не знаете что такое и зачем.
GOTO - такой тег означает, что в результатах парсинга этого поля вы получаете какую-то ссылку, по которой нужно перейти, чтобы спарсить информацию для всех полей, которые идут следом за этим. Используется в случае, если на странице выводится не полная информация и нужно куда-то нажать, чтобы получить недостающую часть. Обычно при нажатии на какую-то кнопку сайт отправляет запрос и получает информацию, которую затем отображает. Адрес (ссылка) этого запроса обычно есть на странице - вот вы можете его спарсить в этом “поле” и перейти сразу по этой ссылке.
MAINPAGE - такой тег означает, что нужно вернуться на начальную страницу, чтобы спарсить информацию для всех полей, которые идут следом за этим. Используется вместе с тегом GOTO в случае, когда с главной страницы нужно перейти на несколько дополнительных по разным ссылкам, которые есть в исходном коде главной страницы.
Теги для получения информации в поле
Слева - текст html, который находится слева от вырезаемого значения со страницы. Если значение равно ###, то берется текст с самого начала страницы.
...
Шаблон - здесь указывается шаблон строки, в который подставляется значение, полученное регулярным выражением. Например следующий шаблон https://site.ru/catalog[[value]]
формирует ссылку из ее части, полученной регулярным выражением, полученное значение подставляется вместо [[value]]. Если нужно значение без изменений, то оставляйте поле пустым.
Expand | |||||
---|---|---|---|---|---|
| |||||
например есть такой код страницы, из которого вам нужно получить при этом здесь можно ограничить блок тегами и задать следующее регулярное выражение <p>.+?<br/>(.+?)<p/> в нем встречается текст .+? - он означает, что в этом месте может быть любой текст а так же то же самое, только в скобках (.+?) - это означает то же любой текст, но при этом его нужно сохранить в качестве значения, полученного регулярным выражением. |
...