返回顶部
首页 > 资讯 > 后端开发 > Python >Python 建模步骤
  • 684
分享到

Python 建模步骤

建模步骤Python 2023-01-31 00:01:11 684人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

#%% #载入数据 、查看相关信息 import pandas as pd import numpy as np from sklearn.preprocessing import LabelEncoder print('第一步:加

#%%
#载入数据 、查看相关信息
import pandas as pd
import numpy as np
from  sklearn.preprocessing import LabelEncoder

print('第一步:加载、查看数据')

file_path = r'D:\train\201905data\liwang.csv'

band_data = pd.read_csv(file_path,encoding='UTF-8')

band_data.info()

band_data.shape

#%%
#
print('第二步:清洗、处理数据,某些数据可以使用数据库处理数据代替')

#数据清洗:缺失值处理:丢去、
#查看缺失值
band_data.isnull().sum

band_data = band_data.dropna()
#band_data = band_data.drop(['state'],axis=1)
# 去除空格
band_data['voice_mail_plan'] = band_data['voice_mail_plan'].map(lambda x: x.strip())
band_data['intl_plan'] = band_data['intl_plan'].map(lambda x: x.strip())
band_data['churned'] = band_data['churned'].map(lambda x: x.strip())
band_data['voice_mail_plan'] = band_data['voice_mail_plan'].map({'no':0, 'yes':1})
band_data.intl_plan = band_data.intl_plan.map({'no':0, 'yes':1})

for column in band_data.columns:
    if band_data[column].dtype == type(object):
        le = LabelEncoder()
        band_data[column] = le.fit_transfORM(band_data[column])

#band_data = band_data.drop(['phone_number'],axis=1)
#band_data['churned'] = band_data['churned'].replace([' True.',' False.'],[1,0])
#band_data['intl_plan'] = band_data['intl_plan'].replace([' yes',' no'],[1,0])
#band_data['voice_mail_plan'] = band_data['voice_mail_plan'].replace([' yes',' no'],[1,0])


#%%
# 模型  [重复、调优]
print('第三步:选择、训练模型')

x = band_data.drop(['churned'],axis=1)
y = band_data['churned']

from sklearn import model_selection
train,test,t_train,t_test = model_selection.train_test_split(x,y,test_size=0.3,random_state=1)

from sklearn import tree
model = tree.DecisionTreeClassifier(max_depth=2)
model.fit(train,t_train)

fea_res = pd.DataFrame(x.columns,columns=['features'])
fea_res['importance'] = model.feature_importances_

t_name= band_data['churned'].value_counts()
t_name.index

import graphviz

import os
os.environ["PATH"] += os.pathsep + r'D:\software\developmentEnvironment\graphviz-2.38\release\bin'

dot_data= tree.export_graphviz(model,out_file=None,feature_names=x.columns,max_depth=2,
                         class_names=t_name.index.astype(str),
                         filled=True, rounded=True,
                         special_characters=False)
graph = graphviz.Source(dot_data)
#graph
graph.render("dtr")

#%%
print('第四步:查看、分析模型')

#结果预测
res = model.predict(test)

#混淆矩阵
from sklearn.metrics import confusion_matrix
confmat = confusion_matrix(t_test,res)
print(confmat)

#分类指标 https://blog.csdn.net/akadiao/article/details/78788864
from sklearn.metrics import classification_report
print(classification_report(t_test,res))

#%%
print('第五步:保存模型')

from sklearn.externals import joblib
joblib.dump(model,r'D:\train\201905data\mymodel.model')

#%%
print('第六步:加载新数据、使用模型')
file_path_do = r'D:\train\201905data\do_liwang.csv'

deal_data = pd.read_csv(file_path_do,encoding='UTF-8')

#数据清洗:缺失值处理

deal_data = deal_data.dropna()
deal_data['voice_mail_plan'] = deal_data['voice_mail_plan'].map(lambda x: x.strip())
deal_data['intl_plan'] = deal_data['intl_plan'].map(lambda x: x.strip())
deal_data['churned'] = deal_data['churned'].map(lambda x: x.strip())
deal_data['voice_mail_plan'] = deal_data['voice_mail_plan'].map({'no':0, 'yes':1})
deal_data.intl_plan = deal_data.intl_plan.map({'no':0, 'yes':1})

for column in deal_data.columns:
    if deal_data[column].dtype == type(object):
        le = LabelEncoder()
        deal_data[column] = le.fit_transform(deal_data[column])
#数据清洗

#加载模型
model_file_path = r'D:\train\201905data\mymodel.model'
deal_model = joblib.load(model_file_path)
#预测
res = deal_model.predict(deal_data.drop(['churned'],axis=1))

#%%
print('第七步:执行模型,提供数据')
result_file_path = r'D:\train\201905data\result_liwang.csv'

deal_data.insert(1,'pre_result',res)
deal_data[['state','pre_result']].to_csv(result_file_path,sep=',',index=True,encoding='UTF-8')

 

--结束END--

本文标题: Python 建模步骤

本文链接: https://lsjlt.com/news/182402.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python 建模步骤
    #%% #载入数据 、查看相关信息 import pandas as pd import numpy as np from sklearn.preprocessing import LabelEncoder print('第一步:加...
    99+
    2023-01-31
    建模 步骤 Python
  • Python api构建tensorrt加速模型的步骤详解
    目录一、创建TensorRT有以下几个步骤:二、Python api和C++ api在实现网络加速有什么区别?三、构建TensorRT加速模型 3.1 加载tensorRT...
    99+
    2024-04-02
  • python导入模块的步骤
    这篇文章主要介绍“python导入模块的步骤”,在日常操作中,相信很多人在python导入模块的步骤问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python导入模块的步骤”的疑惑有所帮助!接下来,请跟着小编...
    99+
    2023-06-20
  • hadoop伪分布模式搭建(详细步骤)
    一、前期准备 1. 关闭防火墙 2. 安装好JDK 3. 准备hadoop安装包 二、安装hadoop伪分布模式 1. 在home/hadoop/software/路径下创建hadooptmp目录 2. 解压hadoop-3.3.0.ta...
    99+
    2023-09-20
    hadoop 大数据 服务器
  • python代码创建数据库步骤
    目录 一、安装相应的数据库连接库 二、导入所需的库和模块: 三、建立数据库连接: 四、创建游标对象: 五、执行 SQL 查询和操作: 六、提交更改: 七、关闭数据库连接: 示例代码: 一、安装相应的数据库连接库 根据你使用的数据库类型...
    99+
    2023-10-22
    数据库 python
  • OGG搭建步骤
    AIX-->HP-UX 1,下载GGS安装 tar -xvf  ggs_AIX_ppc_ora102_64bit_v11_1_1_0_0_078.tar 2,创建目录 GGSCI (tes...
    99+
    2024-04-02
  • Python离线安装openpyxl模块的步骤
    openpyxl模块离线安装 背景: 公司的防火墙限制,无法使用pip在线安装,开墙的审批流程较为繁琐,故采取离线安装的方式。 步骤如下: 1、官网https://pypi.o...
    99+
    2024-04-02
  • python模块导入方式浅析步骤
    目录1.模块的使用2.导入模块并使用3.模块的导入方式之from-import 语句4.__all__变量用来控制*5.总结首先啊,在python中我们熟知的py文件就是一个模块,也...
    99+
    2024-04-02
  • python模块安装的步骤是什么
    导入模块是使用Python中的import关键字,import关键字后跟要导入的模块名称。例如,要导入名为math的模块,可以使用以...
    99+
    2024-03-02
    python
  • redis主备模式搭建的步骤是什么
    搭建Redis主备模式可以通过以下步骤完成: 安装Redis:首先在主服务器和备服务器上安装Redis数据库。 配置主服务器...
    99+
    2024-05-22
    redis
  • linux搭建k8s的步骤步骤是什么
    搭建Kubernetes集群在Linux上通常需要以下步骤:1. 安装Docker:Kubernetes需要Docker作为容器运行...
    99+
    2023-10-11
    linux k8s
  • 搭建Python Web环境的详细步骤
    这篇文章主要介绍“搭建Python Web环境的详细步骤”,在日常操作中,相信很多人在搭建Python Web环境的详细步骤问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”搭建Python Web环境的详细步骤...
    99+
    2023-06-17
  • python中argparse模块基础及使用步骤
    目录argparse模块用法一、 概念二、 基础1、 使用步骤1.1 总步骤1.2 创建对象1.3 添加参数1.4 解析参数三、 使用案例argparse模块用法 一、 概念 arg...
    99+
    2024-04-02
  • Oracle重建awr步骤
    1.稳妥起见,建议停机重建 2.如果是rac环境需要修改如下参数: alter system set cluster_database = false scope = spfile; ...
    99+
    2024-04-02
  • python搭建虚拟环境的步骤详解
    前言 相信对于python开发人员来说,机器上有不同的python版本是很正常的,因为开发的项目有的用2.6或2.7,有的就要用3.0+版本,如何把这些不同的版本管理好,保持每个环境的干净和独立,方便不同版...
    99+
    2022-06-04
    详解 步骤 环境
  • 搭建 Selenium+Python开发环境详细步骤
    目录一、写在前面二、环境搭建1、Python环境搭建2、第一个脚本3、可能遇到的问题4、解决办法5、运行效果三、写在最后一、写在前面 我从未想过自己会写python系列的自动化文章,...
    99+
    2024-04-02
  • python搭建web网站的步骤是什么
    Python搭建web网站的步骤如下: 确定需求和功能:首先要明确web网站的需求和功能,包括网站的主题、用户需求、功能模块等。...
    99+
    2024-04-16
    python
  • python学习步骤
    第一阶段 Python常用类库 Python爬虫第二阶段 数学基础第三阶段 机器学习第四阶段 深度学习...
    99+
    2023-01-31
    步骤 python
  • IDEA创建MyBatis配置文件模板的方法步骤
    Mybatis的配置文件不像Spring的配置文件,在Maven当中添加过依赖之后就可以在下面这个地方打开,需要自己去手动去编写配置文件,但是自己编写的话会记不住要引入的DTD,所以...
    99+
    2024-04-02
  • 创建MySQL外键步骤
    本文主要给大家简单讲讲创建MySQL外键步骤,相关专业术语大家可以上网查查或者找一些相关书籍补充一下,这里就不涉猎了,我们就直奔主题吧,希望创建MySQL外键步骤这篇文章可以给大家带来一些实际帮助。1.创建...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作