安装
pip install pyquery
使用
初始化
from pyquery import PyQuery as pq
doc =pq(html) #解析html字符串
doc =pq(“https://www.baidu.com/”) #解析网页
doc =pq(“./a.html”) #解析html 文本
元素选择
- doc(“#wrap .s_from link”)
- 子元素children
- 父元素parent
- 兄弟元素siblings
- 元素属性attr
- 获取文本text
- 获取源码html
- 伪类选择器:doc(“link:first-child”),doc(“link:last-child”),doc(“link:nth-child(2)”),doc(“link:contains(‘hello’)”),doc(“link:contains(‘hello’)”)
常用DOM操作
- addClass removeClass
- attr获取/修改属性
- css添加style属性
- remove 移除标签