По какой-то причине я не могу получить нужную мне таблицу на этой странице

Таблица называется «Счет строки», ниже приведен HTML-код для нее:

<table class="suppress_all sortable stats_table now_sortable" id="line_score" data-cols-to-freeze="1"><thead><tr>
<th>&nbsp;</th>
<th colspan="5">Scoring</th>
</tr></thead><caption>Line Score Table</caption><tbody>
<tr class="thead" data-row="0">
<th>&nbsp;</th>
<th>1</th>
<th>2</th>
<th>3</th>
<th>4</th>
<th>T</th>
</tr>
<tr data-row="1">
<td><a href="/teams/LAL/2020.html">LAL</a></td>
<td class="center">25</td>
<td class="center">29</td>
<td class="center">31</td>
<td class="center">17</td>
<td class="center"><strong>102</strong></td>
</tr>
<tr data-row="2">
<td><a href="/teams/LAC/2020.html">LAC</a></td>
<td class="center">22</td>
<td class="center">40</td>
<td class="center">23</td>
<td class="center">27</td>
<td class="center"><strong>112</strong></td>
</tr>

</tbody></table>

Мой код ниже:

import requests as r
import bs4 as bs

link = "https://basketball-reference.com/boxscores/201910220LAC.html"
resp = r.get(link)

soup = bs.BeautifulSoup(resp.content, 'lxml')

table = soup.find('table', {'class':'suppress_all sortable stats_table now_sortable'})

print table

Я хочу использовать данные в <tr data-row="1"> and <tr data-row="2"> позже в другом месте.

Я уверен, что это легко, но я просто не могу обернуть голову, любая помощь очень ценится.

Спасибо, Луи

1
Lou 27 Дек 2019 в 07:57
Я думаю, что содержимое resp не html, можете ли вы распечатать его, чтобы проверить
 – 
Bryan
27 Дек 2019 в 08:18
1
Если вы посмотрите на источник страницы, вы увидите, что таблица находится в комментарии. Вы можете искать похожие вопросы, в которых нужно извлечь данные из комментария.
 – 
Keyur Potdar
27 Дек 2019 в 08:25
 – 
Keyur Potdar
27 Дек 2019 в 08:31
 – 
QHarr
27 Дек 2019 в 11:23

1 ответ

from selenium import webdriver
from bs4 import BeautifulSoup
from selenium.webdriver.firefox.options import Options
import time
import pandas as pd

options = Options()
options.add_argument('--headless')

driver = webdriver.Firefox(options=options)
driver.get("https://www.basketball-reference.com/boxscores/201910220LAC.html")
time.sleep(2)
soup = BeautifulSoup(driver.page_source, 'html.parser')

df = pd.read_html(driver.page_source)[18:19]

print(df)

Выход:

[  Unnamed: 0  Scoring  Scoring.1  Scoring.2  Scoring.3 Scoring.4
0        NaN        1          2          3          4         T
1        LAL       25         29         31         17       102
2        LAC       22         40         23         27       112]
0
αԋɱҽԃ αмєяιcαη 27 Дек 2019 в 08:41