BeautifulSoup


In [ ]:
from bs4 import BeautifulSoup

In [ ]:
import requests

In [ ]:
req = requests.get("http://pythonscraping.com/pages/page3.html")

In [ ]:
bs = BeautifulSoup(req.text, "html.parser")

In [ ]:
bs.find({"span"})

In [ ]:
bs.findAll({"span"})

Lidando com filhos e outros descendentes

Se você o escrevesse usando a função descendants() em vez da função children(), outras tags seriam encontradas (img, span, entre outros). É muito importante diferenciar filhos e descendentes!

Para listar as linhas de produtos da tabela giftList.


In [ ]:
for filho in bs.find("table", {"id":"giftList"}).children:
    print(filho)

Lidando com irmãos

Para exibir todas as linhas de produtos da tabela.


In [ ]:
for irmao in bs.find("table", {"id":"giftList"}).tr.next_siblings:
    print(irmao)

In [ ]: