返回顶部
首页 > 资讯 > 后端开发 > Python >数据解析
  • 742
分享到

数据解析

数据 2023-01-30 22:01:28 742人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

1.指定url 2.发起请求 3.获取页面数据 4.解析数据 5.持久化存储 正则 import re # 提取出python key = 'javaPython-PHP' re.findall('python',key) re.f

1.指定url
2.发起请求
3.获取页面数据
4.解析数据
5.持久化存储

正则

import re
# 提取出python
key = 'javaPython-PHP'
re.findall('python',key)
re.findall('python',key)[0]
# 提取helloworld
key = '<html><h1>hello world</h1></html>'
re.findall('<h1>(.*?)</h1>',key)[0]
# 提取 170
string = '我喜欢身高170的女生'
re.findall('\d+',string)[0]
# 提取出Http:// 和https://
key = 'http://www.baidu.com and https://bobo.com'
#方法一   ? 出现0次或一次
re.findall('https?://',key)
# 方法二
re.findall('https{0,1}://',key)
# 提取出hit.
key = 'bobo@hit.edu.com'
re.findall('h.*\.',key) #['hit.edu.'] 贪婪模式下,尽可能多的匹配
re.findall('h.*?\.',key) # 加一个问号,切换到非贪婪模式
# 匹配sas或者saaas
key = 'saas and sas saaas'
re.findall('sa{1,2}s',key)
# 匹配出i开头的行  re.S-基于单行匹配  re.M-基于多行匹配
key ='''fall in love with you 
i love you very much
i love you
i love you 
'''
re.findall('^i.*',key,re.M)
# 匹配所有的行
key = '''<div>静夜思
窗前明月光
疑是地上霜
举头望明月
低头思故乡
</div>'''
re.findall('<div>.*</div>',key,re.S)

练习

 1 import requests
 2 import re
 3 import os
 4 # 指定url
 5 url = 'https://www.qiushibaike.com/pic/'
 6 # 自定义请求头信息
 7 headers={
 8     'User-Agent':'Mozilla/5.0 (windows NT 6.3; WOW64) AppleWEBKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
 9 
10 }
11 # 发起请求
12 response=requests.get(url=url,headers=headers)
13 # 获取页面数据
14 page_text = response.text
15 # 数据解析
16 img_list=re.findall('<div class="thumb">.*?<img src="(.*?)".*?>.*?</div>',page_text,re.S)
17 
18 #创建一个存储图片的文件夹
19 if not os.path.exists('./imgs'):
20     os.makedirs('./imgs')
21     
22 for url in img_list:
23     img_url='https:'+url
24     img_data=requests.get(url=img_url,headers=headers).content
25     imgName = url.split('/')[-1]
26     imgPath = 'imgs/'+imgName
27     with open(imgPath,'wb')as fp:
28         fp.write(img_data)
29         print(imgName+"写入成功")

 

--结束END--

本文标题: 数据解析

本文链接: https://lsjlt.com/news/180273.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 数据解析
    1.指定url 2.发起请求 3.获取页面数据 4.解析数据 5.持久化存储 正则 import re # 提取出python key = 'javapython-php' re.findall('python',key) re.f...
    99+
    2023-01-30
    数据
  • android解析JSON数据
    JSONObject的使用  一、 JSON对象的使用: String content = "{'username': 'linux', 'password': '...
    99+
    2022-06-06
    json数据 JSON Android
  • Python数据解析 - jsonpat
    参考文档 http://goessner.net/articles/JsonPath/ https://pypi.python.org/pypi/jsonpath/0.75 # !/usr/bin/env python #...
    99+
    2023-01-31
    数据 Python jsonpat
  • Python3 JSON 数据解析
    JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。 Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数: ...
    99+
    2023-01-31
    数据 JSON
  • 数据分析见解
    引言: 在竞争激烈的当今商业环境中,数据分析已成为企业成功不可或缺的一部分。它使企业能够从庞大的数据集中提取有价值的见解,从而赋能决策制定、改善运营并创造竞争优势。本文将探讨的本质、重要性以及如何利用它们来推动业务增长。 的本质: 是通过...
    99+
    2024-03-03
    数据分析、商业智能、数据挖掘、机器学习、决策制定
  • 【Python爬虫】数据解析之bs4解析和xpath解析
    🔥一个人走得远了,就会忘记自己为了什么而出发,希望你可以不忘初心,不要随波逐流,一直走下去🎶 🦋 欢迎关注🖱点赞👍收...
    99+
    2023-09-06
    python 爬虫 开发语言
  • 爬虫之数据解析
      一、啥是数据解析   在上一篇关于爬虫的博客里,我提到过,整个爬虫分为四个部分,上一篇博客已经完成了前两步,也就是我说的最难的地方,接下来这一步数据解析不是很难,但就是很烦人,但只要你有耐心,一步一步查找、排除就会提取出目标信息,这一...
    99+
    2023-01-30
    爬虫 数据
  • SpringMVC解析JSON请求数据问题解析
    这几年都在搞前后端分离、RESTful风格,我们项目中也在这样用。前几天有人遇到了解析JSON格式的请求数据的问题,然后说了一下解析的方式,今天就写篇文章简单的分析一下后台对于JSON格式请求数据是怎么解析的。先把例子的代码贴出来:前端&l...
    99+
    2023-05-31
    spring mvc json
  • python数据解析之XPath详解
    目录XPathXPath使用方法案例—58二手房总结XPath XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。 x...
    99+
    2024-04-02
  • MySQL数据库迁移OpenGauss数据库解析
    目录环境安装OpenGauss创建并导入数据修改后端项目部署后端项目部署前端项目环境 华为云服务器 4核 8G Centos 8.0 64位 JDK11Data Gripxshellxftpmysql 8 安装OpenG...
    99+
    2024-04-02
  • 用Python解剖数据:深入数据分析
    深入数据分析: 数据探索 Python提供了一系列库和模块,如NumPy、Pandas和Matplotlib,用于数据探索。这些工具允许您加载、浏览和操作数据,以了解其分布、模式和异常值。例如: import pandas as pd i...
    99+
    2024-02-17
    Python 数据分析 数据探索 数据可视化 机器学习
  • 如何优化数据库的数据解析
    数据库的数据解析可以通过以下几种方法来优化: 使用合适的数据类型:选择适当的数据类型可以减少数据存储的空间,并提高数据解析的效率。例如,将整数存储为整型数据类型而不是字符型数据类型。 建立索引:在经常进行查询的列上建立索引可以加快数...
    99+
    2024-07-03
    数据库
  • android JSON解析数据 android解析天气预报
    概要 笔者近期做到对天气预报JSON数据解析,在此小记。 天气预报接口:http://wthrcdn.etouch.cn/weather_mini?citykey...
    99+
    2022-06-06
    json解析 android json解析 天气预报 JSON 数据 天气 Android
  • Android解析JSON数据的方法分析
    本文实例讲述了Android解析JSON数据的方法。分享给大家供大家参考,具体如下: JSON作为一种“轻量”的数据结构传递数据,在JS中有广泛的应用 Google公司对JSO...
    99+
    2022-06-06
    json数据 JSON 方法 Android
  • Python的xpath数据解析案例分析
    这篇“Python的xpath数据解析案例分析”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Python的xpath数据解析...
    99+
    2023-06-29
  • python 数据分析之 HTML文件解析
    python 数据分析之 HTML文件解析 一 :Html1. Html 理解2. Html 介绍3. Html 构成4. HTML结构 介绍1> HTML文件结构A: 文档类型声明B: 根标...
    99+
    2023-09-02
    html python 数据分析
  • MySQL数据类型全解析
    2 数值类型 数值类型是最基本的类型,可以分为整数类型与浮点数类型. 2.1 整型 类型 字节数 无符号范围 有符号范围 TINYINT 1 [0,255] [-128,127] SMALLINT 2 [0,65535] ...
    99+
    2014-07-01
    MySQL数据类型全解析
  • 一文解析Apache Avro数据
    摘要:本文将演示如果序列化生成avro数据,并使用FlinkSQL进行解析。 Avro官方文档所写,http://avro.apache.org/docs/current/index.html. Avro简介 avro是...
    99+
    2022-06-04
    ApacheAvro数据 ApacheAvro
  • esp8266如何解析json数据
    这篇文章主要介绍了esp8266如何解析json数据的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇esp8266如何解析json数据文章都会有所收获,下面我们一起来看看吧。#include <A...
    99+
    2023-06-29
  • hadoop解析大数据量excel
    Hadoop是一个开源的分布式计算框架,可以用于处理大数据量的Excel文件。下面是一种使用Hadoop来解析大数据量Excel的方...
    99+
    2023-10-11
    大数据
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作