Python 获取div标签内html内容|去除外层标签,实现innerhtml功能

发表时间:2019-12-23

应用场景:

BeautifulSoup或者其他很多爬虫库爬取HTML网页的时候都带外层标签的,如果不想要外层标签怎么办?

例如想把外层div标签删除

Snipaste_2019-12-20_21-52-47.png


代码:

def getinnerhtml(data):
return data[data.find(">") + 1:data.rfind("</")]

HTML内容用这段代码处理一下就OK了

使用这段代码前需要用.prettify()函数把代码处理下

文章来源互联网,尊重作者原创,如有侵权,请联系管理员删除。邮箱:417803890@qq.com / QQ:417803890


Python Free

邮箱:417803890@qq.com
QQ:417803890

皖ICP备19001818号
© 2019 copyright www.pythonf.cn - All rights reserved

微信扫一扫关注公众号:

联系方式

Python Free