首页
登录 | 注册

爬取网页内容初用

import requests,re

 

if __name__ == '__main__':
r = requests.request('get', 'https://www.168seo.cn/python-2/3410.html', verify = False)
resp = r.headers
body = r.text
print(r.status_code,'------',resp['Content-Type'].split(';')[1].split('=')[1])

result = re.findall('<h4>([a-zA-Z0-9\s\u4e00-\u9fa5]*)</h4>',body,re.S)
for item in result:
print(item)

 

结果为:

200 ------ UTF-8
python 最简洁下载图片的代码
Python Django 返回值是图片
vs code 调试远程代码 ssh remote
给你的 django 网站加个速 gevent django缓存
如何在 Django 中向 MySQL 数据库存入 数组
Centos 安装 RabbitMQ 详细过程
为django admin 增加个action 一对多
python 将相对url路径解析为其绝对路径


相关文章

  • ERP不规范,同事两行泪
    最近的很多次对外交流,都聊到了ERP建设的话题,并且无一例外的不那么让人省心,回想我这么多年走过的ERP坑坑路,在这里也写下经验和总结,希望能给正在或者即将走上ERP建设路的企业一些思考和帮助. 导读 1.几个瞎眼而普遍的案例 2.ERP的 ...
  • 高并发请求的缓存设计策略
    前几天,我司出了个篓子.当时正值某喜闻乐见的关键比赛结束,一堆人打开我司app准备看点东西,结果从来没有感受到过这么多关注量的该功能瞬间幸福到眩晕,触发了熔断,结果就是大量兴致冲冲打开app准备看该比赛结果的人被迫刷了十分钟三天前的野外跑酷 ...
  • 从 docker 到 runC
    笔者在前文<RunC 简介>和<Containerd 简介>中分别介绍了 runC 和 containerd.本文我们将结合 docker 中的其它组件探索 docker 是如何把这些组件组织起来协调工作的. Doc ...
  • More Effective C++
    More Effective C++ 35个改善编程与设计的有效方法 只有深入了解C++编译器如何解释代码, 才有可能用C++语言写出健壮的软件. C++的难学, 不仅在其广博的语法, 语法背后的语义, 语义背后的深层思维, 深层思维背后的 ...
  •     学者写博客已经三个月了,没写过啥技术文章,确实能力有限,还写不出技术文章来,只写了几篇总结和感悟.      时间飞逝,17年已经结束,想对17年总结一下:      17年可以说很重要的一年,毕竟是大学毕业年,结束了大学生活.   ...
  • 详解linux进程间通信-消息队列
    前言:前面讨论了信号.管道的进程间通信方式,接下来将讨论消息队列. 一.系统V IPC 三种系统V IPC:消息队列.信号量以及共享内存(共享存储器)之间有很多相似之处. 每个内核中的 I P C结构(消息队列.信号量或共享存储段)都用一个 ...

2019 cecdns.com webmaster#cecdns.com
12 q. 0.076 s.
京ICP备10005923号