Я хочу проанализировать некоторые веб-страницы в Google Play (например, это ), чтобы получить текущую версию игры, общее количество загрузок и т. д. Я не новичок в Java, но немного новичок в разборе. Я что-то слышал о библиотеке JSOUP и пытался разобраться с этим, но столкнулся с проблемой.

Похоже, что Google Play не предоставляет надлежащий HTML-документ (исходный код страницы довольно понятен). Я думаю, что изначально страница загружается и только после этого, используя JS, данные загружаются на страницу. Классы div / span имеют одинаковые имена, и я получил что-то вроде этого:

<span class="htlgb">December 16, 2019</span>
<span class="htlgb">20M</span>
<span class="htlgb">100,000+</span>
<span class="htlgb">1.5.7</span>
<span class="htlgb">4.0 and up</span>

Как это сделать? Какие-нибудь советы? Могу ли я решить это с JSOUP или нет?

0
Miroha 20 Дек 2019 в 21:17

1 ответ

Вы должны будете просто держать свой парсер курс с сайтом . На данный момент вы должны будете предположить, что первое span с именем этого класса является датой, второе span - представлениями, третье span - установками и т. Д. Вы можете получить список {{ Х3 }} элементов с классом { { Х4 } } и определить их на основе индекса .

Однако, если вы сделаете некоторые другие предположения, вы можете быть более уверенными. Например , вы можете узнать, какие { { X0 } } является дата , поскольку его текст будет включать в месяц ( т.е. декабря ) .

0
keyhan 20 Дек 2019 в 18:21