开发者社区 问答 正文

用bs4爬取标签内的text的问题

def get_coursename(info):
  info = get_content(url)
  soup = BeautifulSoup(info)
  
  all_coursename = soup.find_all('h2', class_="color-primary-text headline-1-text flex-1")
  
  #print all_coursename
  
  f = open("course_coursename.txt","w")
  for coursename in all_coursename:
      detail = soup.h2.get_text()
      
      print detail
      f.write(detail + '\n' )
      f.close
  return all_coursename

以上是我的代码,使用soup.find_all()函数后在coursera得到64个标签段,但是使用递归对象和写入文件后,controlb后得到了64个第一个课程的名字,如下,求大神解答

Buddhism and Modern Psychology
Buddhism and Modern Psychology
.

展开
收起
杨冬芳 2016-06-12 13:51:38 2562 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • IT从业

    你的for循环里应该使用循环变量coursename而不是soup

    2019-07-17 19:33:52 举报
    赞同 展开评论

    评论

    全部评论 (0)

    登录后可评论
问答地址: