SVM算法的理解及其Python实现多分类和二分类问题

SVM算法理解 Python实现多分类 Python实现二分类 2023-02-01 15:02:34 422人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

目录原理分类理论确定最大间距SVM多分类python实现多分类二分类总结原理 SVM被提出于1964年，在二十世纪90年代后得到快速发展并衍生出一系列改进和扩展算法，在人像识别、文本

原理

SVM被提出于1964年，在二十世纪90年代后得到快速发展并衍生出一系列改进和扩展算法，在人像识别、文本分类等模式识别（pattern recognition）问题中有得到应用。

支持向量机（Support Vector Machine, SVM）是一类按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），其决策边界是对学习样本求解的最大边距超平面（maximum-margin hyperplane）

SVM可以通过核方法（kernel method）进行非线性分类，是常见的核学习（kernel learning）方法之一。

分类理论

在分类问题中给定输入数据和学习目标：X = { X1, X2,…Xn }，Y = { y1,y2,…yn}。

其中输入数据的每个样本都包含多个特征并由此构成特征空间（feature space）：Xi = { x1,x2…xn} ，而学习目标为二元变量 y { − 1 , 1 } y\{-1,1\} y{−1,1}表示负类（negative class）和正类（positive class）。

若输入数据所在的特征空间存在作为决策边界（decision boundary）的超平面将学习目标按正类和负类分开，并使任意样本的点到平面距离大于等于1,则称该分类问题具有线性可分性，参数 w，b分别为超平面的法向量和截距。

满足该条件的决策边界实际上构造了2个平行的超平面作为间隔边界以判别样本的分类：

所有在上间隔边界上方的样本属于正类，在下间隔边界下方的样本属于负类。

两个间隔边界的距离 d = 2 ∥ w ∥ d=\frac{2}{\|w\|} d=∥w∥2被定义为边距（margin），位于间隔边界上的正类和负类样本为支持向量（support vector）。

确定最大间距

SVM多分类

SVM算法最初是为二值分类问题设计的，当处理多类问题时，就需要构造合适的多类分类器。

目前，构造SVM多类分类器的方法主要有两类：

一类是直接法，直接在目标函数上进行修改，将多个分类面的参数求解合并到一个最优化问题中，通过求解该最优化问题“一次性”实现多类分类。这种方法看似简单，但其计算复杂度比较高，实现起来比较困难，只适合用于小型问题中；
另一类是间接法，主要是通过组合多个二分类器来实现多分类器的构造，常见的方法有one-against-one和one-against-all两种。

a.一对多法（one-versus-rest,简称1-v-r-SVMs）。

训练时依次把某个类别的样本归为一类,其他剩余的样本归为另一类，这样k个类别的样本就构造出了k个SVM。分类时将未知样本分类为具有最大分类函数值的那类。

b.一对一法（one-versus-one,简称1-v-1 SVMs）。

其做法是在任意两类样本之间设计一个SVM，因此k个类别的样本就需要设计k(k-1)/2个SVM。当对一个未知样本进行分类时，最后得票最多的类别即为该未知样本的类别。Libsvm中的多类分类就是根据这个方法实现的。

Python实现

多分类

  	X_train, X_test, y_train, y_test = train_test_split(feature, label, test_size=.2,random_state=0)
    # 训练模型
    model = OneVsRestClassifier(svm.SVC(kernel='linear',probability=True,random_state=random_state))
    print("[INFO] Successfully initialize a new model !")
    print("[INFO] Training the model…… ")
    clt = model.fit(X_train,y_train)
    print("[INFO] Model training completed !")
    # 保存训练好的模型，下次使用时直接加载就可以了
    joblib.dump(clt,"F:/python/model/conv_19_80%.pkl")
    print("[INFO] Model has been saved !")
  
    y_test_pred = clt.predict(X_test)
    ov_acc = metrics.accuracy_score(y_test_pred,y_test)
    print("overall accuracy: %f"%(ov_acc))
    print("===========================================")
    acc_for_each_class = metrics.precision_score(y_test,y_test_pred,average=None)
    print("acc_for_each_class:\n",acc_for_each_class)
    print("===========================================")
    avg_acc = np.mean(acc_for_each_class)
    print("average accuracy:%f"%(avg_acc))

二分类

>>> import numpy as np
>>> X = np.array([[-1, -1], [-2, -1], [1, 1], [2, 1]])
>>> y = np.array([1, 1, 2, 2])
>>> from sklearn.svm import SVC
>>> clf = SVC()
>>> clf.fit(X, y) 
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
    decision_function_shape='ovr', degree=3, gamma='auto', kernel='rbf',
    max_iter=-1, probability=False, random_state=None, shrinking=True,
    tol=0.001, verbose=False)
>>> print(clf.predict([[-0.8, -1]]))
[1]

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。

您可能感兴趣的文档:

--结束END--

本文标题: SVM算法的理解及其Python实现多分类和二分类问题

本文链接: https://lsjlt.com/news/193869.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

SVM算法的理解及其Python实现多分类和二分类问题

目录原理分类理论确定最大间距SVM多分类Python实现多分类二分类总结原理 SVM被提出于1964年，在二十世纪90年代后得到快速发展并衍生出一系列改进和扩展算法，在人像识别、文本...

99+

2023-02-01

SVM算法理解 Python实现多分类 Python实现二分类
Python实现支持向量机（SVM）分类：算法原理详解

在机器学习中，支持向量机（SVM）常被用于数据分类和回归分析，是由分离超平面的判别算法模型。换句话说，给定标记的训练数据，该算法输出一个对新示例进行分类的最佳超平面。支持向量机（SVM）算法模型是将示例表示为空间中的点，经过映...

99+

2024-01-24

机器学习算法的概念
Python实现机器学习算法的分类

Python算法的分类对葡萄酒数据集进行测试，由于数据集是多分类且数据的样本分布不平衡，所以直接对数据测试，效果不理想。所以使用SMOTE过采样对数据进行处理，对数据去重，去空，处...

99+

2024-04-02
使用Python处理KNN分类算法的实现代码

目录KNN分类算法的介绍测试数据Python代码实现结果分析简介：我们在这世上，选择什么就成为什么，人生的丰富多彩，得靠自己成就。你此刻的付出，决定了你未来成为什么样的人...

99+

2024-04-02
Python基于纹理背景和聚类算法实现图像分割详解

目录一.基于纹理背景的图像分割二.基于K-Means聚类算法的区域分割三.总结一.基于纹理背景的图像分割该部分主要讲解基于图像纹理信息（颜色）、边界信息（反差）和背景信息的图像分割...

99+

2023-01-03

Python 纹理图像分割 Python 聚类算法图像分割 Python图像分割
python基于Node2Vec实现节点分类及其可视化示例详解

目录简介实现过程加载数据集使用Node2vec嵌入数据训练分类器可视化节点嵌入简介 Node2vec是一种用于图嵌入（Graph Embedding）的方法，可用于节点分...

99+

2023-05-17

Node2Vec节点分类可视化 python Node2Vec
C++多态的实现与原理及抽象类实例分析

这篇文章主要讲解了“C++多态的实现与原理及抽象类实例分析”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“C++多态的实现与原理及抽象类实例分析”吧！多态的概念多态：从字面意思来看，就是事物...

99+

2023-06-29
Python利用scikit-learn实现近邻算法分类的示例详解

scikit-learn库 scikit-learn已经封装好很多数据挖掘的算法现介绍数据挖掘框架的搭建方法 1.转换器（Transformer）用于数据预处理，数据转换 2.流水...

99+

2023-02-28

Python scikit-learn近邻算法分类 Python 近邻算法分类 Python scikit-learn
详解Python查找算法的实现(线性,二分,分块,插值)

目录1. 线性查找2. 二分查找3. 插值查找4. 分块查找5. 总结查找算法是用来检索序列数据（群体）中是否存在给定的数据（关键字），常用查找算法有：线性查找：线性查找也称为顺序...

99+

2024-04-02
Java、Unix和JavaScript的分布式计算优势及其实现方法。

Java、Unix和JavaScript的分布式计算优势及其实现方法随着互联网技术的发展，分布式计算已经成为了现代计算机技术的重要研究领域之一。Java、Unix和JavaScript作为目前广泛使用的编程语言，在分布式计算方面有着自己的...

99+

2023-09-10

unix 分布式 javascript
Python基于决策树算法的分类预测怎么实现

今天小编给大家分享一下Python基于决策树算法的分类预测怎么实现的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。一、决策树的...

99+

2023-06-26
Python实现二分法查找及优化的示例详解

目录1.二分查找的原理2.二分查找的实现3.二分查找的优化4.总结二分查找法（Binary Search）是一种在有序数组中查找某一特定元素的算法，它的思想是将数组从中间分成两部分，...

99+

2023-05-16

Python实现二分法查找 Python二分法查找 Python查找
C++数据结构分析多态的实现与原理及抽象类

目录多态的概念虚函数多态构成的条件C++11override和final重载、重写和重定义（隐藏）抽象类多态的原理虚函数表原理单继承和多继承的虚表单继承的虚表多继承的虚函数表几个值得...

99+

2024-04-02
利用python实现聚类分析K-means算法的详细过程

K-means算法介绍 K-means算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近...

99+

2024-04-02
matlab遗传算法求解车间调度问题分析及实现源码

目录一、车间调度简介1 车间调度定义2 传统作业车间调度二、遗传算法简介1 遗传算法概述2 遗传算法的特点和应用3 遗传算法的基本流程及实现技术3.1 遗传算法的基本流程3.2 遗传...

99+

2024-04-02
评价模型（一）层次分析法（AHP）,熵权法，TOPSIS分析及其对应 PYTHON 实现代码和例题解释

数学建模系列文章：以下是个人在准备数模国赛时候的一些模型算法和代码整理，有空会不断更新内容：评价模型（一）层次分析法（AHP）,熵权法，TOPSIS分析及其对应 PYTHON 实现代码和例题解释...

99+

2023-10-25

数学建模
Python计算分类问题的评价指标(准确率、精确度、召回率和F1值，Kappa指标)

机器学习的分类问题常用评论指标有：准确率、精确度、召回率和F1值，还有kappa指标。每次调包去找他们的计算代码很麻烦，所以这里一次性定义一个函数，直接计算所有的评价指标。每次输入预测值和真实值就可以得到上面的指标值，很方便。下面...

99+

2023-09-17

分类机器学习 pandas 数据挖掘 python
Android实现类似IOS右滑返回的效果(原因分析及解决办法)

使用类库SwipeBackLayout https://github.com/Issacw0ng/SwipeBackLayout 出现的问题： 1. 主Activity返回...

99+

2022-06-06

IOS Android
好程序员分享面向对象概念的理解以及ES3和ES6中类的写法

　　好程序员分享面向对象概念的理解以及ES3和ES6中类的写法，本文将从以下四个方面进行讲解：　　1、面向对象的概念　　2、类和对象的概念　　3、 ES6中类的写法　　4、 ES3中“类”...

99+

2023-06-03
Python的代理类实现,控制访问和修改属性的权限你都了解吗

目录本篇文章主要内容代理类的一个简单的实现方式示例一个实现日志输出的代理类的简化示例总结本篇文章主要内容代理类主要功能是将一个类实例的属性访问和控制代理到代码内部另外一个实例类，将...

99+

2024-04-02