新大榭论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

《新大榭》- 创大榭地方网络社区先锋品牌 新大榭始终专注于地方网络社区平台的建设 关于我们- [大记事]- 留言建议- [新手报道]

发布 .新大榭软件管家(Excel版) V6.0版 财务/仓库/生产/销售/采购/行政/人事/校园 .公告 - 客户 - 打赏 - 职场 - Excel - Python.

新大榭镜像-音乐-法律-图书-高中课堂-实验 广告是为了能更好的发展 [欢迎商家支持本站互利共赢] 广告位招租.首页黄金广告位等您来!联系 13566035181

查看: 229|回复: 0

[模块] 8040 - python库【parsel】网页解析模块[爬虫相关]

 关闭 [复制链接]
发表于 2022-2-2 11:38:15 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转新大榭论坛!

您需要 登录 才可以下载或查看,没有账号?注册

x
  1. import requests
    4 ~* \- b4 b; g2 u6 V+ v
  2. import parsel( `/ u2 }# D, m( s3 ?5 @
  3. response = requests.get(url)
    - i! \5 P# S2 |: y/ L
  4. sel = parsel.Selector(response.text)  #注意这里的S要大写
    $ t% [% G* S! O
  5. # re正则7 c5 b- k4 }" L. p; K% q5 F3 B. |8 s
  6. # print(sel.re('正则匹配格式'))- y6 m4 u3 E/ a' o1 y- o/ O: T
  7. # xpath! h! q; N9 q: B
  8. # print(sel.xpath('xpath').getall()) #getall获取所有! h  I* v, q0 e% N
  9. # css选择器
    5 R; G* @; @2 z1 Y8 m
  10. # print(sel.css('css选择器 ::text').extract_first())#获取第一个
复制代码
xpath课程讲义 https://www.runoob.com/xpath/xpath-syntax.html
1 i' B: A# ^6 R! M% S, B( p9 W
新大榭Python学习社区培训、Excel业务指导、办公软件定制、网站建设;新大榭探索实验室欢迎您!http://lab.daxie.net.cn/
Q群推荐 大榭本地求职招聘QQ群,欢迎转发分享本地招聘信息资讯! 官方招聘1群(已满);官方招聘2群:315816937 *
您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|小黑屋|新大榭 ( 浙ICP备16018253号-1 )|点击这里给站长发消息|

GMT+8, 2026-5-15 11:41 , Processed in 0.078467 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表