织梦CMS - 轻松建站从此开始!

沙龙国际_沙龙国际网上娱乐_沙龙网上娱乐

当前位置: 主页 > 沙龙国际首页 >

BeautifulSoup获取的tag不完整。

时间:2017-07-18 01:25来源:未知 作者:admin 点击:
1.问题描述 通过 urllib2.urlopen().read() 打印出的html源码中tbody有多对tr标签,但是使用 soup.findAll("tbody") 获取的tr标签就只有两对,而且内容不全,希望大神帮助。 2. 源代码: # -*- coding:

1.问题描述
通过urllib2.urlopen().read()打印出的html源码中tbody有多对tr标签,但是使用soup.findAll("tbody")获取的tr标签就只有两对,而且内容不全,希望大神帮助。

2. 源代码:

# -*- coding: UTF-8 –*-
import urllib2
from bs4 import BeautifulSoup

Url = 'http://guojijuzhuqufh.fang.com/chengjiao/'

response = urllib2.urlopen(Url)
text = response.read().decode('gbk')
soup = BeautifulSoup(text, "lxml")
tbodyList = soup.findAll("tbody")

for li in tbodyList:
    print li

3. 网页部分源代码


      
      (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
推荐内容