На странице есть глобальная переменная, содержащая объект, для которого я бы хотел настроить парсер. Как лучше всего сделать это с помощью Node / Express / потенциально Cheerio?

Я понимаю преимущества Cheerio при обходе DOM, но я знаю имя глобальной переменной, которую хочу очистить, и мне просто нужно извлечь ее информацию по заданному расписанию.

0
lfkwtz 8 Янв 2017 в 22:23
Что такое «глобальная переменная на странице»? вы имеете в виду переменную javascript в коде, вставленном на страницу?
 – 
PA.
8 Янв 2017 в 22:38
Ага. На веб-сайте есть глобальная переменная, которая является объектом. Если я перейду на этот сайт и введу это имя переменной в свою консоль, он вернет нужный мне объект. Есть ли способ с помощью Node I очистить эту переменную?
 – 
lfkwtz
8 Янв 2017 в 22:43

1 ответ

Лучший ответ

Cheerio - это просто синтаксический анализатор dom, поэтому у вас не будет доступа к любому javascriot или любому сгенерированному javascript контенту.

Вам нужно что-то вроде PhantomJS, имитирующего браузер. Взгляните на этот ответ на Stackoverflow

2
Community 23 Май 2017 в 15:01
Спасибо, это похоже на то, что мне нужно
 – 
lfkwtz
9 Янв 2017 в 18:12