返回顶部
首页 > 资讯 > 后端开发 > Python >bs4--xlwt存入excel
  • 875
分享到

bs4--xlwt存入excel

xlwtexcel 2023-01-30 22:01:08 875人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

在python标准库中,并没有直接操作Excel模块,需要借助第三方模块xlrd模块负责从Excel中读取数据xlwt则是将数据写入到Excel中去 这里需要用到xlwt模块,从第三方库中安装xlwt模块很简单,一条命令足以pip

在python标准库中,并没有直接操作Excel模块,需要借助第三方模块

xlrd模块负责从Excel中读取数据

xlwt则是将数据写入到Excel中去

 

这里需要用到xlwt模块,从第三方库中安装xlwt模块很简单,一条命令足以

pip3 install xlwt


先写一个简单的python程序测试一下,创建一个名为excelwrite.py文件,代码如下:

# 导入xlwt模块
import xlwt


if __name__ == '__main__':
    # 创建一个Workbook对象book,
    book = xlwt.Workbook(encoding='utf8', style_compression=0)

    # 创建一个sheet对象,并添加表名为dede
    # 一个excel可以有多个表,每个表都有对应的表名
    sheet = book.add_sheet('dede')

    # 向dede表中添加数据
    sheet.write(0, 0, 'hstking')  # 0行0列写入hstking
    sheet.write(1, 0, '中文测试')  # 1行0列写入中文测试
    sheet.write(1, 1, 'ceshi')   # 1行1列写入ceshi
    
    # 将以上操作保存到指定的Excel文件中
    book.save('ceshi.xls')  # 里面写的是路径,不写代表当前目录下


运行程序:

会在当前目录下生成一个名为ceshi.xls的文件

blob.png


打开Excel文件内容如下:

blob.png



在之前双色球项目的同目录下创建一个save2excel.py文件,用来把数据存入excel文件的,内容如下:

#!/usr/bin/env python
# coding: utf-8
import xlwt


class SaveExcel(object):
    def __init__(self, items):
        self.items = items
        self.run(self.items)

    def run(self, items):
        filename = '双色球.xls'
        book = xlwt.Workbook(encoding='utf8', style_compression=0)
        # cell_overwrite_ok,表示是否可以覆盖单元格
        sheet = book.add_sheet('ball', cell_overwrite_ok=True)
        sheet.write(0, 0, '开奖时间')
        sheet.write(0, 1, '期号')
        sheet.write(0, 2, '红1')
        sheet.write(0, 3, '红2')
        sheet.write(0, 4, '红3')
        sheet.write(0, 5, '红4')
        sheet.write(0, 6, '红5')
        sheet.write(0, 7, '红6')
        sheet.write(0, 8, '蓝')
        sheet.write(0, 9, '销售金额')
        sheet.write(0, 10, '一等奖')
        sheet.write(0, 11, '二等级')
        i = 1
        while i <= len(items):
            item = items[i-1]
            sheet.write(i, 0, item.lottery_date)
            sheet.write(i, 1, item.lssue)
            sheet.write(i, 2, item.red1)
            sheet.write(i, 3, item.red2)
            sheet.write(i, 4, item.red3)
            sheet.write(i, 5, item.red4)
            sheet.write(i, 6, item.red5)
            sheet.write(i, 7, item.red6)
            sheet.write(i, 8, item.blue)
            sheet.write(i, 9, item.money)
            sheet.write(i, 10, item.firstprize)
            sheet.write(i, 11, item.secondprize)
            i += 1
        book.save(filename)


if __name__ == '__main__':
    pass


更改之前的get_caipiao.py文件,加上excel存储

#!/usr/bin/env Python
# coding: utf-8
from bs4 import BeautifulSoup
import urllib.request
from mylog import MyLog as mylog
from save2excel import SaveExcel
import re
import time


class CaiPiaoItem(object):
    lottery_date = None  # 开奖日期
    lssue = None   # 期号
    red1 = None  # 第一个红色球号码
    red2 = None  # 第二个红色球号码
    red3 = None  # 第三个红色球号码
    red4 = None  # 第四个红色球号码
    red5 = None  # 第五个红色球号码
    red6 = None  # 第六个红色球号码
    blue = None  # 蓝色球号码
    money = None  # 销售额
    firstprize = None  # 一等奖人数
    secondprize = None  # 二等奖人数


class GetCaiPiao(object):
    def __init__(self):
        self.urls = []
        self.filename = '双色球.txt'
        self.log = mylog()
        self.geturls()
        self.items = self.spider(self.urls)
        self.pipelines(self.items)
        self.log.info('开始存入数据到Excel\r\n')
        SaveExcel(self.items)
        self.log.info('写入Excel结束\r\n')

    def geturls(self):
        # 初始url地址
        url = 'Http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html'
        htmlcontent = self.getresponsecontent(url)
        soup = BeautifulSoup(htmlcontent, 'lxml')
        # 获取最后一个p标签
        tag = soup.find_all(re.compile('p'))[-1]
        # 取出总页数---115
        pages = tag.strong.get_text()
        for i in range(1, int(pages)+1):
            # 拼接每一页的url地址
            url = r'http://kaijiang.zhcw.com/zhcw/html/ssq/list_' + str(i) + '.html'
            self.urls.append(url)  # 把每个url地址添加到urls列表
            self.log.info(u'添加URL:{}到URLS\r\n'.fORMat(url))  # 记录日志

        with open(self.filename, 'w', encoding='utf-8') as f:
            f.write("开奖日期   期号\t红1 红2 红3 红4 红5 红6 蓝7\t销售额\t1等奖人数\t二等奖人数\n")

    def spider(self, urls):
        items = []
        for url in urls:
            htmlcontent = self.getresponsecontent(url)
            soup = BeautifulSoup(htmlcontent, 'lxml')
            tags = soup.find_all('tr', attrs={})
            for tag in tags:
                if tag.find('em'):
                    item = CaiPiaoItem()  # 实例化CaiPiaoItem类
                    tagtd = tag.find_all('td')
                    item.lottery_date = tagtd[0].get_text()  # 获取开奖日期
                    item.lssue = tagtd[1].get_text()  # 期号
                    itemEM = tagtd[2].find_all('em')  # 获取所有的em标签
                    item.red1 = itemEM[0].get_text()  # 获取第一个红球的号码
                    item.red2 = itemEM[1].get_text()  # 获取第二个红球的号码
                    item.red3 = itemEM[2].get_text()  # 获取第三个红球的号码
                    item.red4 = itemEM[3].get_text()  # 获取第四个红球的号码
                    item.red5 = itemEM[4].get_text()  # 获取第五个红球的号码
                    item.red6 = itemEM[5].get_text()  # 获取第六个红球的号码
                    item.blue = itemEM[6].get_text()  # 获取蓝球的号码
                    item.money = tagtd[3].find('strong').get_text()  # 获取销售额
                    item.firstprize = tagtd[4].find('strong').get_text()  # 获取一等奖中奖人数
                    item.secondprize = tagtd[5].find('strong').get_text()  # 获取二等奖中奖人数
                    items.append(item)  # 把item对象添加到items列表
                    self.log.info(u'获取日期为:{}的数据成功'.format(item.lottery_date))  # 记录日志
        return items  # 返回items列表

    def pipelines(self, items):
        with open(self.filename, 'a', encoding='utf-8') as f:
            for item in items:
                f.write('{} {}\t{} {} {} {} {} {} {}\t{}\t{}\t{}\n'.\
                        format(item.lottery_date, item.lssue, item.red1, item.red2, item.red3, item.red4,\
                               item.red5, item.red6, item.blue,item.money,item.firstprize,item.secondprize))
                self.log.info('将日期为:{}的数据存入{}'.format(item.lottery_date, self.filename))

    def getresponsecontent(self, url):
        try:
            response = urllib.request.urlopen(url)
            html = response.read().decode('utf-8')
        except Exception as e:
            self.log.error(u'Python 返回 url:{} 数据失败\n错误代码:{}\n'.format(url, e))
        else:
            self.log.info(u'Python 返回 url:{} 数据成功\n'.format(url))
            # time.sleep(1)  # 1秒返回一个结果  手动设置延迟防止被封
            return html


if __name__ == '__main__':
    st = GetCaiPiao()


运行主程序get_caipiao.py文件

pycharm截图

blob.png


当前目录下会自动生成 双色球.xls文件,截图如下:

blob.png



代码分析:

mylog.py模块,主要是为程序提供log功能

log功能很重要,在大量爬取的时候,没有log帮助定位,很难找到错误点


save2excel.py模块,用于把数据存入excel表


主程序:

CaiPiaoItem类定义需要获取的数据

GetCaiPiao类为主程序

geturls方法 获取所有需要爬取的url地址

spider方法 提取每个url地址的详细内容(过滤数据)

pipelines方法 处理数据,数据的存储方式,这里使用的txt

getresponsecontent方法 负责发送请求,拿到响应文件(html)


--结束END--

本文标题: bs4--xlwt存入excel

本文链接: https://lsjlt.com/news/179152.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • bs4--xlwt存入excel
    在python标准库中,并没有直接操作Excel模块,需要借助第三方模块xlrd模块负责从Excel中读取数据xlwt则是将数据写入到Excel中去 这里需要用到xlwt模块,从第三方库中安装xlwt模块很简单,一条命令足以pip...
    99+
    2023-01-30
    xlwt excel
  • Python xlwt导出excel完整
    有一组任务数据,要把它excel下载下来,如果仅仅导出,用csv导出就很方便。 但是要导出漂亮的样式,重复的地方要合并单元格,设置背影颜色,字体,边框等。而CSV是纯文本格式,不支持设置各种样式。 研究了一天,把代码写了出来。 ...
    99+
    2023-01-31
    完整 Python xlwt
  • python如何使用xlwt操作excel
    这篇文章主要讲解了“python如何使用xlwt操作excel”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“python如何使用xlwt操作excel”吧!一、安装pip inst...
    99+
    2023-06-26
  • python读写修改Excel之xlrd&xlwt&xlutils
    py读写修改常用的三种方法 xlwt:用于写入 Excel 文件 xlrd:用于读取 Excel 文件 xlutils:用于操作 Excel 文件的实用工具,比如复制、...
    99+
    2024-04-02
  • Python利用xlrd 与 xlwt 模块操作 Excel
    目录Python 操作 Excel打开Excel文件读取数据行的操作获取所有行数据列的操作单元格操作Python 操作 Excel 本篇博客介绍一种 Python 操作 Excel ...
    99+
    2024-04-02
  • Python自动化操作Excel方法详解(xlrd,xlwt)
    目录一、Python操作Excel 7大库对比二、xlrd 读取excel操作1. 打开文件2. 获取所有表名3. 指定sheet表4. 对sheet表的行操作5. 对sheet表的...
    99+
    2024-04-02
  • python怎么使用xlwt操作excel你知道吗
    目录总结一、安装 pip install xlwt 二、创建表格并写入 import xlwt # 创建一个workbook并设置编码 workbook = xlwt.Workboo...
    99+
    2024-04-02
  • python中怎样使用xlrd、xlwt操作excel表格
    这篇文章将为大家详细讲解有关python中怎样使用xlrd、xlwt操作excel表格,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。python操作excel主要用到xlrd和xlwt这两个...
    99+
    2023-06-04
  • 利用Python第三方库xlwt写入数据到Excel工作表实例代码
    目录1. 安装 xlwt 库2. 使用 xlwt 库2.1 向 Excel 工作表写入单个数据2.2 向 Excel 工作表写入多个数据2.3 向 Excel 工作表写入多个数据(进...
    99+
    2024-04-02
  • Python使用xlrd和xlwt实现自动化操作Excel
    目录一、前言介绍二、安装三、xlrd常用操作1、打开Excel2、查看工作簿中所有sheet 3、选择一个工作表4、获取表格的行数、列数5、获取整行和整列的值6、通过循环读...
    99+
    2024-04-02
  • Python Excel数据处理之xlrd/xlwt/xlutils模块详解
    目录1、模块说明2、xlrd处理3、xlwt处理4、xlutils处理常规的Excel数据处理中,就是对Excel数据文件的读/写/文件对象操作。 通过对应的python非标准库xl...
    99+
    2023-03-21
    Python Excel数据处理模块 Python Excel数据处理 Python Excel
  • Python3读取Excel数据存入My
    Python是数据分析的强大利器。 利用Python做数据分析,第一步就是学习如何读取日常工作中产生各种excel报表并存入数据中,方便后续数据处理。 这里向大家分享python3如何使用xlrd读取excel,并使用Python3操作p...
    99+
    2023-01-31
    数据 Excel
  • Python如何利用xlrd和xlwt模块操作Excel表格
    目录简介:安装:初始数据:xlrd使用:xlwt使用:xlwt使用示例2:总结 简介: xlrd和xlwt是python的第三方库,xlrd模块实现对excel文件内容读取...
    99+
    2024-04-02
  • Python怎么利用xlrd和xlwt模块操作Excel表格
    这篇文章主要为大家展示了“Python怎么利用xlrd和xlwt模块操作Excel表格”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Python怎么利用xlrd和xlwt模块操作Excel表格”...
    99+
    2023-06-29
  • 利用Python中xlwt模块操作excel的示例详解
    目录一、安装二、创建表格并写入三、设置单元格样式四、设置单元格宽度五、设置单元格背景色六、设置单元格内容对齐方式七、单元格添加超链接八、单元格添加公式九、单元格中输入日期十、合并行和...
    99+
    2024-04-02
  • bs4爬虫实战三:获取电影信息并存入mysql数据库
    目标分析这次爬虫的目标网站是:http://dianying.2345.com,爬虫的搜索目标仅限于今年的电影,在网站打开搜索,在年代中选择2018 获取页面的过程在页面的下方单击"下一页",发现URL变成了http:/...
    99+
    2023-01-30
    爬虫 实战 数据库
  • Python第三方库xlrd/xlwt的安装与读写Excel表格
    前言 相信大家都应该有所体会,在平时经常会遇到处理 Excel 表格数据的情况,人工处理起来实在是太麻烦了,我们可以使用 Python 来解决这个问题,我们需要两个 Python 扩展, xlrd 和 xl...
    99+
    2022-06-04
    第三方 表格 Python
  • python使用xlrd与xlwt对excel的读写和格式设定
    前言 python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。本文主要介绍了python使用xlrd与xlwt对excel的读写和格式设定,下面话...
    99+
    2022-06-04
    格式 xlrd python
  • Python Excel数据处理之xlrd/xlwt/xlutils模块怎么使用
    常规的Excel数据处理中,就是对Excel数据文件的读/写/文件对象操作。通过对应的python非标准库xlrd/xlwt/xlutils,来实现具体的数据处理业务逻辑。在复杂的Excel业务数据处理中,三兄弟扮演的角色缺一不可。今天我们...
    99+
    2023-05-17
    Python Excel xlutils
  • Python使用xlrd和xlwt批量读写excel文件的示例代码
    目录一、使用xlrd对excel进行数据读取二、使用xlwt写入excel一、使用xlrd对excel进行数据读取 excel表格示例: 安装xlrd库 pip install x...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作