Quad.Wiki
Парсер по ссылкам: Пример 1
1. Нужно в программе добавить прайс и загрузить в него ссылки.
Если поставщик вам дает прайс, в котором есть ссылки на карточки товара, то можно использовать этот прайс и не создавать новый, т.е. нужно чтобы в этом прайсе ссылка была загружена в поле “Страница товара (URL)”.
В прайсе нужно обязательно поставить птичку “Обновлять только поля содержащие данные”, чтобы при новой загрузке прайса не затерлась информация, полученная парсером.
Если эти ссылки вы собираете вручную, то можете сделать документ в Google Docs, где будете указывать ссылку на товар и какой-то Код товара, по которому можно 1 в 1 связать ваш товар и товар поставщика по ссылке. Например, использовать для этого QID товара.
Используя GoogleDocs можно ссылки добавлять с любого компьютера в интернете, т.е. дать доступ, например, фрилансеру, который заполнит ссылки.
2. Настройте автоматическое скачивание файла по ссылке или из почты
Скачиваете прайс или же файл из GoogleDocs, где заполняете ссылки.
Sync.X - Получение файлов из Web (по ссылкам)
Sync.X - Получение файлов из почты (email)
3. Добавляем новый парсер
Открываем вкладку Автоматизация / внизу Парсеры и нажимаем кнопку Добавить, указываем название парсера.
Для парсера по ссылкам выставляем птички так, как на скриншете выше.
Птичка “Обновить список товаров” значит, что программа во время запуска парсера будет загружать товары и ссылки на них из прайса, указанного в настройках.
Птичка “Парсер карточек товаров” значит, что нужно будет парсить только карточки товаров, т.е. парсер по ссылке из прайса будет заходить сразу в карточку.
Значение выпадающего списка “Только связанные со ссылкой” означает, что в парсер из прайса поставщика будут попадать только товары, которые связаны со своим товаром и у которых загружена/добавлена ссылка.
Птичка “Парсить только товары с пустым Значение 1” - чтобы не парсились товары, которые уже спарсили ранее.
4. Создаем прайс, в который будет сохраняться информация парсинга
Если у вас ссылки загружены из прайса поставщика или из GoogleDocs, то добавлять новый прайс не нужно, выберите существующий прайс, в который загружены ссылки, в выпадающем списке.
Переходим во вкладку Настройки.
Тип прайса выбираем Другой (для описаний). Если вам нужно парсить оптовые цены или цены конкурентов, то выбирайте Поставщик или Конкурент.
В открывшемся окне введите название прайса и нажмите Ок.
5. Выбираем поля, в которые будет сохраняться информация
В верхнее поле указывается поле товара, которое будет использовано для поиска товара на сайте-источнике (откуда будет парсинг). Если вы не будете ничего искать, а у вас есть готовые ссылке, то здесь можно выбрать поле Название.
В нижних полях для прайса результатов выбираются 2 поля: поле в которое сохраняется ссылка и поле, в которое сохраняется ИД товара. Эти поля уже созданы в программе и выбирайте такие же, как на скриншете
Если поля уже были созданы в базе, то они заполнятся сразу при добавлении парсера
После ввода настроек сохраните их.
6. Настройка полей парсинга
Найдите на сайте, откуда будете парсить информацию, какую-то карточку товара, содержащую по максимуму информацию. Т.е. чтобы было несколько фото у товара, все нужные описания и поля, характеристики товаров. Так же вам понадобится карточка товара, у которого есть только 1 фото, так как оно может выводиться не так, как в случае с несколькими фото.
Если вы парсите только цены и остатки, то вам нужно найти разные карточки товара, в которых:
нет скидки, есть скидка (цена может по-разному выводиться в зависимости от этого)
товар в разных статусах наличия, например В наличии, Под заказ, Нет в наличии
Найденные карточки товаров добавьте для теста во вкладке Результаты.
Перейдите во вкладку Настройки / 6. Обработка - здесь вы увидите уже созданные по умолчанию поля. Вы можете удалить те поля, информация которых не будет парситься.
Примеры настройки полей:
Разбор карточки товара: Пример 1
Инструкция по настройке полей для парсинга: Парсер информации из карточек товаров