...

вторник, 2 августа 2016 г.

Небольшой скрипт для отслеживания цен avito из Google Spreadsheet

Хочу поделиться с сообществом небольшим скриптом для загрузки цен с сайта объявлений AVITO в Google Spreadsheet. Вдруг кому-нибудь еще пригодится.

Логика такая — в цикле бежим по ячейкам таблицы с адресами и запрашиваем странички. Из полученных страниц получаем цену и подставляем в соседние ячейки. Запуск скрипта через пункт меню Avito -> Update Prices.

Page Sample
(наименнннование sic!)

Далее пошаговая инструкция. Заранее прошу прощения, у не владеющих, что названия и пункты меню на английском языке. Думаю по картинкам вы сможете воспроизвести шаги в русском интерфейсе.

Чтобы получить подобную страничку делаем следующее:

1) Создаем документ Google Spreadsheet
(http://ift.tt/1kzKMt6 -> Start a new spreadsheet -> Blank)
Create New Blank Spreadsheet

2) Поиском находим на авито интересующие нас объявления и подставляем их адреса в наш документ. Должно получиться что-то вроде
Fill URLs

3) Создаем Named Range «URL». Для этого выбираем Data -> Named Ranges…
Named Ranges
Ставим курсор на первый адрес в нашем списке и нажимаем + Add a range, вводим URL и нажимаем Done.
Named Range Params

4) Заходим в редактор скриптов Tools -> Script Editor
Run Script Editor

Стираем существующий и вставляем следующий код:

function priceToStr(pPrice){
  var res = parseInt(pPrice.replace(/\D/g, ""));
  return res;
}
  
function onOpen() {
  var ui = SpreadsheetApp.getUi();
  ui.createMenu('Avito')
      .addItem('Update Prices', 'updatePrices')
      .addToUi();
}

function updatePrices() {
  var sheet = SpreadsheetApp.getActiveSheet();
  var ss = SpreadsheetApp.getActiveSpreadsheet();
  var range = ss.getRangeByName('URL');  
  var firstRow = range.getRow();
  var firstCol = range.getColumn();
  var howManyRowsRead = 50;
  Logger.log('firstRow = ' + firstRow);
  Logger.log('firstCol = ' + firstCol);
  
  var data = sheet.getRange(firstRow, firstCol, howManyRowsRead, 1).getValues();

  LLL: for (var i = 0; i < data.length; i++) {
    var url = data[i][0];
    
    if (!url) break LLL;
    
    var prevPriceCell = sheet.getRange(firstRow+i, firstCol+2);
    var priceCell = sheet.getRange(firstRow+i, firstCol+1);
    prevPriceCell.setValue(priceCell.getValue());
    priceCell.setValue('0');
    
    var options =
        {
          headers : {'Cache-Control' : 'max-age=0', 
                     'Referer': 'http://ift.tt/2aF6Qav',
                     'Upgrade-Insecure-Requests': '1',
                     'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36'},           
          muteHttpExceptions: true,
        };
    var response = UrlFetchApp.fetch(url, options).getContentText();
    var p1 = '<span itemprop="price">';
    var l1 = response.indexOf(p1);
    var p2 = '</span>';
    var l2 = response.indexOf(p2, l1 + p1.length);
    Logger.log('l1 = ' + l1);
    Logger.log('l2 = ' + l2);
    if (l1 != -1 && l2 != -1)
    {
      var price = response.substring(l1 + p1.length,l2);      
      Logger.log('price = ' + price);
      priceInt = priceToStr(price);
      Logger.log('priceInt = ' + priceInt);
      priceCell.setValue(priceInt);
    }
  }
}

Сохраняем. Имя скрипта значения не имеет.
Save Script

На этом все готово! Можно закрыть редактор скриптов, обновить Spreadsheet. Должен появиться пункт меню Avito -> Update Prices.
Выбираем его, даем нужные права и смотрим как заполняются цены в нашем документе.
PS Если в процессе произошла ошибка — в поиске причины помогут логи доступные из редактора скриптов Tools -> Script Editor -> View -> Logs.

Комментарии (0)

    Let's block ads! (Why?)

    Комментариев нет:

    Отправить комментарий