notebook.community

Edit and run



In [3]:

    
from bs4 import BeautifulSoup

import requests



In [6]:

    
page = requests.get('https://www.npr.org/programs/all-things-considered/')



In [10]:

    
soup = BeautifulSoup(page.content, 'html.parser')



In [36]:

    
articles = soup.find_all('article', {'class': "rundown-segment"})



In [37]:

    
len(articles)









    Out[37]:





22



In [55]:

    
for article in articles:
    audio = article.find('a', {'class': 'audio-module-listen'})
    audioLink = audio.attrs['href']
    print audioLink









    



https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_buzzfeed_reports_trump_directed_cohen_to_lie_to_congress.mp3?orgId=1&topicId=1014&d=255&p=2&story=686696821&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_week_in_politics_the_buzzfeed_report_trump_and_pelosi_and_a_2nd_summit_with_north_korea.mp3?orgId=1&topicId=1014&d=453&p=2&story=686696828&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_more_spending_on_education_for_low-income_kids_improves_their_prospects.mp3?orgId=1&topicId=1013&d=261&p=2&story=686696835&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_billboard_reports_that_r_kelly_has_been_dropped_by_rca_records.mp3?orgId=1&topicId=1106&d=237&p=2&story=686641970&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_white_house_says_there_will_be_a_second_summit_with_north_korea.mp3?orgId=1&topicId=1122&d=221&p=2&story=686696842&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_who_is_north_korean_diplomat_kim_yong-chol.mp3?orgId=1&topicId=1125&d=273&p=2&story=686696849&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_looking_back_on_the_first_government_shutdown_in_us_history.mp3?orgId=1&topicId=1014&aggIds=94427042&d=215&p=2&story=686696856&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_glass_-_review.mp3?orgId=1&topicId=4467349&d=267&p=2&story=686696912&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_with_chicken_wire_and_frame_foam_bob_carr_expressed_uncontainable_joy.mp3?orgId=1&topicId=1062&d=212&p=2&story=686533352&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_trump_cohen_barr.mp3?orgId=1&topicId=1014&d=375&p=2&story=686696919&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_chicago_police_and_african-americans.mp3?orgId=1&topicId=1003&d=248&p=2&story=686696926&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_right_to_life_march.mp3?orgId=1&topicId=1003&d=230&p=2&story=686696933&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_nfl_quarterback_matchups.mp3?orgId=1&topicId=1055&d=256&p=2&story=686696940&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_trump_and_pelosi.mp3?orgId=1&topicId=1014&d=200&p=2&story=686696947&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_i_alone_can_fix_it.mp3?orgId=1&topicId=1014&d=207&p=2&story=686696954&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_order_order.mp3?orgId=1&topicId=1124&d=74&p=2&story=686696961&siteplayer=true&dl=1
https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_korea-sexual_abuse.mp3?orgId=1&topicId=1055&d=221&p=2&story=686696968&siteplayer=true&dl=1






    



---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-55-62f08ee9013a> in <module>()
      1 for article in articles:
      2     audio = article.find('a', {'class': 'audio-module-listen'})
----> 3     audioLink = audio.attrs['href']
      4     print audioLink

AttributeError: 'NoneType' object has no attribute 'attrs'



In [ ]:



In [45]:



In [53]:

    
audioLink = audio.attrs['href']



In [54]:

    
audioLink









    Out[54]:





u'https://ondemand.npr.org/anon.npr-mp3/npr/atc/2019/01/20190118_atc_buzzfeed_reports_trump_directed_cohen_to_lie_to_congress.mp3?orgId=1&topicId=1014&d=255&p=2&story=686696821&siteplayer=true&dl=1'



In [ ]: