У меня проблемы с получением ссылок на статьи с атрибутом href со страницы с XPath. Итак, это результат запроса с использованием расширения Chrome XPath Helper на https: //www.ethics.senate ....

0
Anon Li 2 Янв 2021 в 10:13

1 ответ

Лучший ответ

Проблема заключается в используемом выражении xpath. Поскольку в конце вы используете //@href, вы получаете сообщение об ошибке, потому что возвращаемые результаты на самом деле относятся не к типу element, а к attribute:

Message: invalid selector: The result of the xpath expression "//table[@class="table recordList"]//@href" is: [object Attr]. It should be an element.

Помимо этого, вы также получаете значок прикрепленных файлов href, который может соответствовать вашим требованиям, а может и не соответствовать его требованиям.

Чтобы получить только ссылки на статьи, вы можете использовать это выражение xpath:

//table[@class="table recordList"]//a[@class=\'ContentGrid\']

Если вам нужны и URL-адрес статьи, и URL-адрес вложений, вы можете использовать это:

//table[@class="table recordList"]//a[@class='ContentGrid' or @title='View Files']
1
Cosmin 2 Янв 2021 в 07:39