Python 建模步骤

建模步骤 Python 2023-01-31 00:01:11 684人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

#%% #载入数据、查看相关信息 import pandas as pd import numpy as np from sklearn.preprocessing import LabelEncoder print('第一步：加

#%%
#载入数据 、查看相关信息
import pandas as pd
import numpy as np
from  sklearn.preprocessing import LabelEncoder

print('第一步：加载、查看数据')

file_path = r'D:\train\201905data\liwang.csv'

band_data = pd.read_csv(file_path,encoding='UTF-8')

band_data.info()

band_data.shape

#%%
#
print('第二步：清洗、处理数据，某些数据可以使用数据库处理数据代替')

#数据清洗:缺失值处理：丢去、
#查看缺失值
band_data.isnull().sum

band_data = band_data.dropna()
#band_data = band_data.drop(['state'],axis=1)
# 去除空格
band_data['voice_mail_plan'] = band_data['voice_mail_plan'].map(lambda x: x.strip())
band_data['intl_plan'] = band_data['intl_plan'].map(lambda x: x.strip())
band_data['churned'] = band_data['churned'].map(lambda x: x.strip())
band_data['voice_mail_plan'] = band_data['voice_mail_plan'].map({'no':0, 'yes':1})
band_data.intl_plan = band_data.intl_plan.map({'no':0, 'yes':1})

for column in band_data.columns:
    if band_data[column].dtype == type(object):
        le = LabelEncoder()
        band_data[column] = le.fit_transfORM(band_data[column])

#band_data = band_data.drop(['phone_number'],axis=1)
#band_data['churned'] = band_data['churned'].replace([' True.',' False.'],[1,0])
#band_data['intl_plan'] = band_data['intl_plan'].replace([' yes',' no'],[1,0])
#band_data['voice_mail_plan'] = band_data['voice_mail_plan'].replace([' yes',' no'],[1,0])


#%%
# 模型  [重复、调优]
print('第三步：选择、训练模型')

x = band_data.drop(['churned'],axis=1)
y = band_data['churned']

from sklearn import model_selection
train,test,t_train,t_test = model_selection.train_test_split(x,y,test_size=0.3,random_state=1)

from sklearn import tree
model = tree.DecisionTreeClassifier(max_depth=2)
model.fit(train,t_train)

fea_res = pd.DataFrame(x.columns,columns=['features'])
fea_res['importance'] = model.feature_importances_

t_name= band_data['churned'].value_counts()
t_name.index

import graphviz

import os
os.environ["PATH"] += os.pathsep + r'D:\software\developmentEnvironment\graphviz-2.38\release\bin'

dot_data= tree.export_graphviz(model,out_file=None,feature_names=x.columns,max_depth=2,
                         class_names=t_name.index.astype(str),
                         filled=True, rounded=True,
                         special_characters=False)
graph = graphviz.Source(dot_data)
#graph
graph.render("dtr")

#%%
print('第四步：查看、分析模型')

#结果预测
res = model.predict(test)

#混淆矩阵
from sklearn.metrics import confusion_matrix
confmat = confusion_matrix(t_test,res)
print(confmat)

#分类指标 https://blog.csdn.net/akadiao/article/details/78788864
from sklearn.metrics import classification_report
print(classification_report(t_test,res))

#%%
print('第五步：保存模型')

from sklearn.externals import joblib
joblib.dump(model,r'D:\train\201905data\mymodel.model')

#%%
print('第六步：加载新数据、使用模型')
file_path_do = r'D:\train\201905data\do_liwang.csv'

deal_data = pd.read_csv(file_path_do,encoding='UTF-8')

#数据清洗:缺失值处理

deal_data = deal_data.dropna()
deal_data['voice_mail_plan'] = deal_data['voice_mail_plan'].map(lambda x: x.strip())
deal_data['intl_plan'] = deal_data['intl_plan'].map(lambda x: x.strip())
deal_data['churned'] = deal_data['churned'].map(lambda x: x.strip())
deal_data['voice_mail_plan'] = deal_data['voice_mail_plan'].map({'no':0, 'yes':1})
deal_data.intl_plan = deal_data.intl_plan.map({'no':0, 'yes':1})

for column in deal_data.columns:
    if deal_data[column].dtype == type(object):
        le = LabelEncoder()
        deal_data[column] = le.fit_transform(deal_data[column])
#数据清洗

#加载模型
model_file_path = r'D:\train\201905data\mymodel.model'
deal_model = joblib.load(model_file_path)
#预测
res = deal_model.predict(deal_data.drop(['churned'],axis=1))

#%%
print('第七步：执行模型，提供数据')
result_file_path = r'D:\train\201905data\result_liwang.csv'

deal_data.insert(1,'pre_result',res)
deal_data[['state','pre_result']].to_csv(result_file_path,sep=',',index=True,encoding='UTF-8')

您可能感兴趣的文档:

--结束END--

本文标题: Python 建模步骤

本文链接: https://lsjlt.com/news/182402.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

Python 建模步骤

#%% #载入数据、查看相关信息 import pandas as pd import numpy as np from sklearn.preprocessing import LabelEncoder print('第一步：加...

99+

2023-01-31

建模步骤 Python
Python api构建tensorrt加速模型的步骤详解

目录一、创建TensorRT有以下几个步骤：二、Python api和C++ api在实现网络加速有什么区别？三、构建TensorRT加速模型 3.1 加载tensorRT...

99+

2024-04-02
python导入模块的步骤

这篇文章主要介绍“python导入模块的步骤”，在日常操作中，相信很多人在python导入模块的步骤问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”python导入模块的步骤”的疑惑有所帮助！接下来，请跟着小编...

99+

2023-06-20
hadoop伪分布模式搭建(详细步骤）

一、前期准备 1. 关闭防火墙 2. 安装好JDK 3. 准备hadoop安装包二、安装hadoop伪分布模式 1. 在home/hadoop/software/路径下创建hadooptmp目录 2. 解压hadoop-3.3.0.ta...

99+

2023-09-20

hadoop 大数据服务器
python代码创建数据库步骤

目录一、安装相应的数据库连接库二、导入所需的库和模块：三、建立数据库连接：四、创建游标对象：五、执行 SQL 查询和操作：六、提交更改：七、关闭数据库连接：示例代码：一、安装相应的数据库连接库根据你使用的数据库类型...

99+

2023-10-22

数据库 python
OGG搭建步骤

AIX-->HP-UX 1，下载GGS安装 tar -xvf ggs_AIX_ppc_ora102_64bit_v11_1_1_0_0_078.tar 2，创建目录 GGSCI (tes...

99+

2024-04-02
Python离线安装openpyxl模块的步骤

openpyxl模块离线安装背景：公司的防火墙限制，无法使用pip在线安装，开墙的审批流程较为繁琐，故采取离线安装的方式。步骤如下： 1、官网https://pypi.o...

99+

2024-04-02
python模块导入方式浅析步骤

目录1.模块的使用2.导入模块并使用3.模块的导入方式之from-import 语句4.__all__变量用来控制*5.总结首先啊，在python中我们熟知的py文件就是一个模块，也...

99+

2024-04-02
python模块安装的步骤是什么

导入模块是使用Python中的import关键字，import关键字后跟要导入的模块名称。例如，要导入名为math的模块，可以使用以...

99+

2024-03-02

python
redis主备模式搭建的步骤是什么

搭建Redis主备模式可以通过以下步骤完成：安装Redis：首先在主服务器和备服务器上安装Redis数据库。配置主服务器...

99+

2024-05-22

redis
linux搭建k8s的步骤步骤是什么

搭建Kubernetes集群在Linux上通常需要以下步骤：1. 安装Docker：Kubernetes需要Docker作为容器运行...

99+

2023-10-11

linux k8s
搭建Python Web环境的详细步骤

这篇文章主要介绍“搭建Python Web环境的详细步骤”，在日常操作中，相信很多人在搭建Python Web环境的详细步骤问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”搭建Python Web环境的详细步骤...

99+

2023-06-17
python中argparse模块基础及使用步骤

目录argparse模块用法一、概念二、基础1、使用步骤1.1 总步骤1.2 创建对象1.3 添加参数1.4 解析参数三、使用案例argparse模块用法一、概念 arg...

99+

2024-04-02
Oracle重建awr步骤

1.稳妥起见，建议停机重建 2.如果是rac环境需要修改如下参数： alter system set cluster_database = false scope = spfile; ...

99+

2024-04-02
python搭建虚拟环境的步骤详解

前言相信对于python开发人员来说，机器上有不同的python版本是很正常的，因为开发的项目有的用2.6或2.7，有的就要用3.0+版本，如何把这些不同的版本管理好，保持每个环境的干净和独立，方便不同版...

99+

2022-06-04

详解步骤环境
搭建 Selenium+Python开发环境详细步骤

目录一、写在前面二、环境搭建1、Python环境搭建2、第一个脚本3、可能遇到的问题4、解决办法5、运行效果三、写在最后一、写在前面我从未想过自己会写python系列的自动化文章，...

99+

2024-04-02
python搭建web网站的步骤是什么

Python搭建web网站的步骤如下：确定需求和功能：首先要明确web网站的需求和功能，包括网站的主题、用户需求、功能模块等。...

99+

2024-04-16

python
python学习步骤

第一阶段 Python常用类库 Python爬虫第二阶段数学基础第三阶段机器学习第四阶段深度学习...

99+

2023-01-31

步骤 python
IDEA创建MyBatis配置文件模板的方法步骤

Mybatis的配置文件不像Spring的配置文件，在Maven当中添加过依赖之后就可以在下面这个地方打开，需要自己去手动去编写配置文件，但是自己编写的话会记不住要引入的DTD，所以...

99+

2024-04-02
创建MySQL外键步骤

本文主要给大家简单讲讲创建MySQL外键步骤，相关专业术语大家可以上网查查或者找一些相关书籍补充一下，这里就不涉猎了，我们就直奔主题吧，希望创建MySQL外键步骤这篇文章可以给大家带来一些实际帮助。1.创建...

99+

2024-04-02