071型船坞登陆舰,行唐县卫星地图,一战电影
HTMLParser需要手动下载markupbase.py放到libs里 每读到一个标签处理一下
from HTMLParser import HTMLParser # markupbase class MyParser(HTMLParser): def handle_decl(self, decl): HTMLParser.handle_decl(self, decl) print('decl %s' % decl) def handle_starttag(self, tag, attrs): HTMLParser.handle_starttag(self, tag, attrs) print('<' + tag + '>') def handle_endtag(self, tag): HTMLParser.handle_endtag(self, tag) print('') def handle_data(self, data): HTMLParser.handle_data(self, data) print('data %s' % data) # def handle_startendtag(self, tag, attrs): HTMLParser.handle_startendtag(self, tag, attrs) def handle_comment(self, data): HTMLParser.handle_comment(self, data) print('data %s' % data) def close(self): HTMLParser.close(self) print('Close') demo = MyParser() demo.feed(open('test.html').read()) demo.close()
如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复
新手学习Python2和Python3中print不同的用法
Python基于os.environ从windows获取环境变量
网友评论