WEB开发网
开发学院软件开发Python python 抓取分析 SGMLParser 实例 阅读

python 抓取分析 SGMLParser 实例

 2010-09-22 11:05:30 来源:WEB开发网   
核心提示:数据:希望 抓取div > p id='da' > a text和 div > p id='da' > html<div> <p id="tt"> <a href=/tag/php>no no</a&

数据:

希望 抓取

div > p id='da' > a text

和 div > p id='da' > html

<div>
   <p id="tt">
     <a href=/tag/php>no no</a>
  </p>
  <p id='da'>
    <a href=/tag/php>php</a>
    <a href=/tag/python>python</a>
    <a href=/tag/vim>vim</a>
    <a href=/tag/windows>windows</a>
   <a href=/tag/wingide>wingide</a>
  </p>
</div>
<p id='da'>
   <a href=/tag/wingide>hehe</a>
</p>

希望结果为

$ python t.py
a_text: ["'php'", "'python'", "'vim'", "'windows'", "'wingide'"]

 div_html[0]:
 <p id="da">
    <a href="/tag/php">php</a>
    <a href="/tag/python">python</a>
    <a href="/tag/vim">vim</a>
    <a href="/tag/windows">windows</a>
   <a href="/tag/wingide">刘凯毅</a>
  </p>

#说明

其实 SGMLParser 我感觉最关键的是

1 2  下一页

Tags:python 抓取 分析

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接