新大榭论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

《新大榭》- 创大榭地方网络社区先锋品牌 新大榭始终专注于地方网络社区平台的建设 关于我们- [大记事]- 留言建议- [新手报道]

发布 .新大榭软件管家(Excel版) V5.9版 财务/仓库/生产/销售/采购/行政/人事/校园 .公告 - 客户 - 打赏 - 职场 - Excel - Python.

新大榭镜像-音乐-法律-图书-高中课堂-实验 广告是为了能更好的发展 [欢迎商家支持本站互利共赢] 广告位招租.首页黄金广告位等您来!联系 13566035181

查看: 198|回复: 0

[模块] 8040 - python库【parsel】网页解析模块[爬虫相关]

 关闭 [复制链接]
发表于 2022-2-2 11:38:15 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转新大榭论坛!

您需要 登录 才可以下载或查看,没有账号?注册

x
  1. import requests" x& {( B- G' I/ Y3 H$ J9 ?
  2. import parsel( q+ V# w; V8 ^) Q% j4 R5 Z" t
  3. response = requests.get(url)
    5 C7 P+ w# T+ j: C) O3 ^" c- f. T
  4. sel = parsel.Selector(response.text)  #注意这里的S要大写4 _# @7 z5 A9 i3 B4 g$ y5 n6 l
  5. # re正则  P- a: C5 p8 U! W* a* j
  6. # print(sel.re('正则匹配格式'))- M% I0 D+ w; P: D$ M
  7. # xpath
    3 x# Y& }8 R$ C9 D- m1 H
  8. # print(sel.xpath('xpath').getall()) #getall获取所有
    7 ?" f. M+ O' g! U" I, |3 ^/ \! }' E4 l
  9. # css选择器
    1 Y( l  n$ {1 V5 @; ]5 H' \. e! z$ ?/ a
  10. # print(sel.css('css选择器 ::text').extract_first())#获取第一个
复制代码
xpath课程讲义 https://www.runoob.com/xpath/xpath-syntax.html8 N7 H" A3 T/ ]! W/ e3 b2 ]& t
新大榭Python学习社区培训、Excel业务指导、办公软件定制、网站建设;新大榭探索实验室欢迎您!http://lab.daxie.net.cn/
Q群推荐 大榭本地求职招聘QQ群,欢迎转发分享本地招聘信息资讯! 官方招聘1群(已满);官方招聘2群:315816937 *
您需要登录后才可以回帖 登录 | 注册

本版积分规则

新大榭七周年,感谢由您!

文字版|小黑屋|新大榭 ( 浙ICP备16018253号-1 )|点击这里给站长发消息|

GMT+8, 2025-11-3 14:11 , Processed in 0.086382 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表