返回顶部
首页 > 资讯 > 后端开发 > Python >python爬取全国水雨情信息详解
  • 521
分享到

python爬取全国水雨情信息详解

2024-04-02 19:04:59 521人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

目录分析代码结果总结 分析 我们没有找到接口,所以打算利用selenium来爬取。 代码 import datetime import pandas as pd from bs4

分析.png

分析

我们没有找到接口,所以打算利用selenium来爬取。

代码


import datetime
import pandas as pd
from bs4 import BeautifulSoup
from selenium import WEBdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.chrome.options import Options #建议使用谷歌浏览器
import time
chrome_options = Options()
chrome_options.add_argument('--headless')
driver = webdriver.Chrome()

# 存储中英文对应的变量的中文名
Word_dict = {"poiBsnm": "流域",
             "poiAddv": "行政区",
             "rvnm": "河名", 
             "stnm": "站名",
             "tm": "时间", 
             "zl": "水位(米)",
             "ql": "流量(立方米/秒)",
             "wrz": "警戒水位(米)"}
# 空df接收结果
rain_total = pd.DataFrame([])

url = 'Http://xxfb.mwr.cn/sq_dxsk.html'
driver.get(url)
time.sleep(5)
infos = driver.find_elements_by_xpath("/html/body//tbody[@id='DataContainer']/tr")
# pd.set_option('display.max_columns', None)#所有列
# pd.set_option('display.max_rows', None)#所有行

# 列表提取
for info in infos:
    poiBsnm = info.find_element_by_xpath("./td[1]").text
    poiAddv = info.find_element_by_xpath("./td[2]").text
    rvnm = info.find_element_by_xpath("./td[3]").text
    stnm = info.find_element_by_xpath("./td[4]").text
    tm = info.find_element_by_xpath("./td[5]").text
    zl = info.find_element_by_xpath("./td[6]").text
    ql = info.find_element_by_xpath("./td[7]").text
    wrz = info.find_element_by_xpath("./td[8]").text
# 组成pandas对象
    rain_data = [[poiBsnm,poiAddv,rvnm,stnm,tm,zl,ql,wrz]]  
    rain_df = pd.DataFrame(data=rain_data,columns=list(word_dict.values()))
    rain_total = pd.concat([rain_total,rain_df])
    print(rain_total)
# 关闭浏览器
driver.close()
# 保存数据
data_str = datetime.datetime.now().strftime('%Y_%m_%d')
rain_total.to_csv("%s_全国水雨情信息.csv" % (data_str),index=None, encoding="GB18030")

结果

结果.png

总结

时间爬取出现了一点问题,我也很不理解,其次,循环哪里应该可以简洁代码,写的不是很好,第三,没有形成模块化的代码。还有就是谢谢崔工的支持。

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注编程网的更多内容!

--结束END--

本文标题: python爬取全国水雨情信息详解

本文链接: https://lsjlt.com/news/155044.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • python爬取全国水雨情信息详解
    目录分析代码结果总结 分析 我们没有找到接口,所以打算利用selenium来爬取。 代码 import datetime import pandas as pd from bs4...
    99+
    2024-04-02
  • Python爬虫获取基金净值信息详情
    目录1 前言2 获取基金净值3 数据库结构设计4 如何进行数据存储5 总结1 前言 前面的文章中我们已经获取到了基金的阶段变动信息和ETF信息的获取,那么在本章中,我们将继续前面的内...
    99+
    2024-04-02
  • Python如何用三步爬取全网情诗信息
    Python如何用三步爬取全网情诗信息,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。前言还在为如何写情书而苦恼吗?还在担心自己文采不够?没关系、Python带你穿越时空领略...
    99+
    2023-06-02
  • Python怎样爬取全网美食杰信息
    这期内容当中小编将会给大家带来有关Python怎样爬取全网美食杰信息,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。前言相信很多人是吃货,其实我也是一个吃货,所以在美食杰这网站上,爬取每一道美食的做法,名字...
    99+
    2023-06-02
  • Python实现爬取房源信息的示例详解
    目录前言分析页面,寻找切入点爬取数据整理数据,导出文件前言 最近由于工作突然变动,新的办公地点离现在的住处很远,必须要换房子租了。 我坐上中介的小电驴,开始探索城市各处的陌生角落。 ...
    99+
    2024-04-02
  • 如何用python代码爬取全国所有必胜客餐厅信息
    如何用python代码爬取全国所有必胜客餐厅信息,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。当我刚接触 Python 时,我已经被 Python 深深所吸引。...
    99+
    2023-06-16
  • 详解使用Selenium爬取豆瓣电影前100的爱情片相关信息
    什么是Selenium Selenium是一个用于测试网站的自动化测试工具,支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器,同时也支持phantomJ...
    99+
    2024-04-02
  • 用python爬取分析淘宝商品信息详解技术篇
    目录背景介绍一、模拟登陆二、爬取商品信息1. 定义相关参数2. 分析并定义正则3. 数据爬取三、简单数据分析1.导入库2.中文显示3.读取数据4.分析价格分布5.分析销售地分布6.词...
    99+
    2024-04-02
  • 详解如何使用Python网络爬虫获取招聘信息
    目录前言项目目标项目准备反爬措施项目实现效果展示小结前言 现在在疫情阶段,想找一份不错的工作变得更为困难,很多人会选择去网上看招聘信息。可是招聘信息有一些是错综复杂的。而且不能把全部...
    99+
    2024-04-02
  • 用python爬取中国大学排名网站排名信息
     程序解决问题如下: 利用python网络爬虫爬取中国大学排名网站上的排名信息,将排名前20的大学的信息保存为文本文件,并在窗口打印出这20所大学的信息,按列打印和保存。 ...
    99+
    2024-04-02
  • python爬取各省降水量及可视化详解
    在具体数据的选取上,我爬取的是各省份降水量实时数据 话不多说,开始实操 正文  1.爬取数据 使用python爬虫,爬取中国天气网各省份24时整点气象数据 ...
    99+
    2024-04-02
  • 怎么用python爬取中国大学排名网站排名信息
    今天就跟大家聊聊有关怎么用python爬取中国大学排名网站排名信息,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。 程序解决问题如下:利用python网络爬虫爬取中国大学排名...
    99+
    2023-06-29
  • python获取对象信息的实例详解
    1、获取对象类型,基本类型可以用type()来判断。 >>> type(123) <class 'int'> >>> type('str') <class '...
    99+
    2022-06-02
    python 对象信息
  • 详解python并发获取snmp信息及性能测试
    python & snmp 用python获取snmp信息有多个现成的库可以使用,其中比较常用的是netsnmp和pysnmp两个库。网上有较多的关于两个库的例子。 本文重点在于如何并发的获取snmp的数...
    99+
    2022-06-04
    详解 性能测试 信息
  • 如何用Python从桌面读取二维码信息详解
    目录前言安装条码SDK从屏幕扫描二维码添加用于剪切事件的按钮创建自定义Qt小部件拍摄屏幕图像隐藏和显示应用程序窗口测试屏幕二维码阅读器总结前言 日常生活中,我们通常会拿出智能手机扫描...
    99+
    2024-04-02
  • Python 详解通过Scrapy框架实现爬取百度新冠疫情数据流程
    目录前言环境部署插件推荐爬虫目标项目创建webdriver部署项目代码Item定义中间件定义定义爬虫pipeline输出结果文本配置文件改动验证结果总结前言 闲来无聊,写了一个爬虫程...
    99+
    2024-04-02
  • python读取与写入tif图片的完整信息(过程详解)
    目录python读取与写入tif图片的完整信息一、导入gdal包读取if写入tif补充:用python读取tif格式图像,opencv读取python读取与写入tif图片的完整信息 ...
    99+
    2023-05-18
    python读取与写入tif python写入tif
  • Python 详解爬取并统计CSDN全站热榜标题关键词词频流程
    前言 最近在出差,发现住的宾馆居然有小强。所以出差无聊之际,写了点爬虫的代码玩玩,问就是应景。本篇文章主要是爬取CSDN全站综合热榜的100个标题,然后分词提取关键词,统计一下词频。...
    99+
    2024-04-02
  • Python 详解通过Scrapy框架实现爬取CSDN全站热榜标题热词流程
    目录前言环境部署实现过程创建项目定义Item实体关键词提取工具爬虫构造中间件代码构造制作自定义pipelinesettings配置执行主程序执行结果总结前言 接着我的上一篇:Pyth...
    99+
    2024-04-02
  • (源码版)2023 年高教社杯全国大学生数学建模竞赛-E 题 黄河水沙监测题一数据分析详解+Python代码
    十分激动啊啊啊题目终于出来了!!官网6点就进去了结果直接卡死现在才拿到题目,我是打算A-E题全部做一遍。简单介绍一下我自己:博主专注建模四年,参与过大大小小数十来次数学建模,理解各类模型原理以及每种模型的建模流程和各类题目分析方法。参与过十...
    99+
    2023-10-05
    数学建模 人工智能 机器学习 数据分析 python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作