返回顶部
首页 > 资讯 > 后端开发 > Python >利用Python抓取行政区划码的方法
  • 145
分享到

利用Python抓取行政区划码的方法

行政区划方法Python 2022-06-04 18:06:10 145人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

前言 国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个python程序将这部分数据抓取下来。 注意:抓取下来以后还要进行简单的人工的整理 示例代码: # -*-

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:


# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'Http://www.stats.Gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNORMal" style=".*?"><span lang="EN-US" style=".*?">(d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:Program FilesTencentQQI18N2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

--结束END--

本文标题: 利用Python抓取行政区划码的方法

本文链接: https://lsjlt.com/news/13960.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 利用Python抓取行政区划码的方法
    前言 国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。 注意:抓取下来以后还要进行简单的人工的整理 示例代码: # -*- ...
    99+
    2022-06-04
    行政区划 方法 Python
  • Java实现获取行政区划的示例代码
    目录背景一、导入jar包二、代码展示背景 公司的行政区划代码有问题,有的没有街道信息,有的关联信息有误,然后找到了国家的网站国家统计局-行政区划,这个里面是包含了所有的行政信息,但是...
    99+
    2023-03-13
    Java获取行政区划方法 Java获取行政区划 Java 行政区划
  • python批量抓取的方法
    今天小编给大家分享一下python批量抓取的方法的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下...
    99+
    2024-04-02
  • 利用Python从网页抓取数据并进行分析
    在当今信息爆炸的时代,网络成为人们获取信息的主要途径之一,而数据挖掘则成为了解析这些海量数据的重要工具。Python作为一种功能强大且易于学习的编程语言,被广泛应用于网络爬虫和数据挖掘...
    99+
    2024-02-25
    python 数据挖掘 网络爬虫
  • 使用python 进行区间取值的方法
    需求背景: 进行分值计算。如下图,如果只是一两个还好说,写写判断,但是如果有几十个,几百个,会不会惨不忍睹。而且,下面的还是三种情况。 例如: 解决: # 根据值、比较list...
    99+
    2024-04-02
  • 使用python抓取B站数据的方法
    这篇文章给大家分享的是有关使用python抓取B站数据的方法的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。概述可以获取的数据包括:video-视频模块user-用户模块dynamic-动态模块这次用“Runnin...
    99+
    2023-06-15
  • mysql 获取执行计划的方法
    mysql 获取执行计划方法:1.通过explain进行查看sql的执行计划;2.通线程正在执行的sql查看该sql的执行计划; explain进行查看sql的执行计划相对简单,其实通线程正在执行的sq...
    99+
    2024-04-02
  • 利用Fiddler对手机进行抓包的实现方法
    用Fiddler对手机进行抓包的设置如下:1、处于同一个局域网下2、PC端,打开Fiddler,设置:(1)打开Tools-Options(2)设置HTTPS(3)设置Connections(4)查看PC的局域网IP地址并记住(5)重启Fi...
    99+
    2023-05-31
    fiddler 手机抓包
  • 获取执行计划的6种方法
      一.获取执行计划的6种方法(详细步骤已经在每个例子的开头注释部分说明了):     1. explain plan for获取;   ...
    99+
    2024-04-02
  • python自动抓取网页的方法是什么
    Python有多种方法可以自动抓取网页,以下是其中常用的几种方法:1. 使用第三方库requests:使用requests库可以发送...
    99+
    2023-09-15
    python
  • Python代码便利并行的方法是什么
    这篇文章主要讲解了“Python代码便利并行的方法是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python代码便利并行的方法是什么”吧!传统的例子简单搜索下"Python ...
    99+
    2023-06-16
  • Python3使用requests包抓取并保存网页源码的方法
    本文实例讲述了Python3使用requests包抓取并保存网页源码的方法。分享给大家供大家参考,具体如下: 使用Python 3的requests模块抓取网页源码并保存到文件示例: import re...
    99+
    2022-06-04
    源码 并保存 网页
  • python抓取并保存html页面时乱码问题的解决方法
    本文实例讲述了python抓取并保存html页面时乱码问题的解决方法。分享给大家供大家参考,具体如下: 在用Python抓取html页面并保存的时候,经常出现抓取下来的网页内容是乱码的问题。出现该问题的原因...
    99+
    2022-06-04
    乱码 解决方法 并保存
  • Python正则抓取网易新闻的方法示例
    本文实例讲述了Python正则抓取网易新闻的方法。分享给大家供大家参考,具体如下: 自己写了些关于抓取网易新闻的爬虫,发现其网页源代码与网页的评论根本就对不上,所以,采用了抓包工具得到了其评论的隐藏地址(每...
    99+
    2022-06-04
    正则 示例 网易新闻
  • Python实现周期性抓取网页内容的方法
    本文实例讲述了Python实现周期性抓取网页内容的方法。分享给大家供大家参考,具体如下: 1.使用sched模块可以周期性地执行指定函数 2.在周期性执行指定函数中抓取指定网页,并解析出想要的网页内容,代码...
    99+
    2022-06-04
    周期性 网页 方法
  • 解决远程页面抓取中的乱码方法步骤
    本篇内容介绍了“解决远程页面抓取中的乱码方法步骤”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!  ff提供...
    99+
    2024-04-02
  • Python获取代码运行时间的几种方法
    Python获取代码运行时间的几种方法1、方法一:#python 的标准库手册推荐在任何情况下尽量使用time.clock().#只计算了程序运行CPU的时间,返回值是浮点数import timestart =time.clock()#中...
    99+
    2023-01-31
    几种方法 代码 时间
  • 用jupyter执行python代码的方法
    1.首先打开Anaconda,找到jupyter然后启动它,或者在cmd中使用jupyter notebook命令启动jupyter,然后会打开jupyter主界面 2. 新建一个notebook 点击New,选择你希望启动的 noteb...
    99+
    2023-09-29
    python jupyter 开发语言
  • python抓取网页内容并保存的方法是什么
    在Python中,可以使用requests库来抓取网页内容,并使用文件操作来保存抓取到的内容。下面是一个示例代码: import r...
    99+
    2024-03-04
    python
  • Python使用正则表达式抓取网页图片的方法示例
    本文实例讲述了Python使用正则表达式抓取网页图片的方法。分享给大家供大家参考,具体如下: #!/usr/bin/python import re import urllib #获取网页信息 def ...
    99+
    2022-06-04
    示例 网页 方法
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作