Python 官方文档:入门教程 => 点击学习
前言 国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个python程序将这部分数据抓取下来。 注意:抓取下来以后还要进行简单的人工的整理 示例代码: # -*-
前言
国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个python程序将这部分数据抓取下来。
注意:抓取下来以后还要进行简单的人工的整理
示例代码:
# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'Http://www.stats.Gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
def get_xzqh():
html_data = requests.get(base_url).content
pattern = re.compile('<p class="MsoNORMal" style=".*?"><span lang="EN-US" style=".*?">(d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
areas = re.findall(pattern,html_data)
print "code,name,level"
for area in areas:
print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
if __name__=='__main__':
get_xzqh()
注意事项:
另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:Program FilesTencentQQI18N2052
如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。
code都是按照ISO3166标准写的,极易导入数据库。
总结
以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。
--结束END--
本文标题: 利用Python抓取行政区划码的方法
本文链接: https://lsjlt.com/news/13960.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
2024-03-01
2024-03-01
2024-03-01
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0