返回顶部
首页 > 资讯 > 后端开发 > Python >python实现最大熵模型
  • 383
分享到

python实现最大熵模型

模型python 2023-01-31 01:01:54 383人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

# encoding: utf-8 ''' Created on 2017-8-7 根据李航<<统计学习方法>>实现 ''' from collections import defaultdict import

# encoding: utf-8
'''
Created on 2017-8-7
根据李航<<统计学习方法>>实现
'''

from collections import defaultdict
import math

class MaxEnt(object):
    def __init__(self):
        self.feats = defaultdict(int)
        self.trainset = []
        self.labels = set()  
      
    def load_data(self, file):
        for line in open(file):
            fields = line.strip().split()
            
            # 数据共3列。第一列为标签,二三列为特征
            if len(fields) < 2: continue
            label = fields[0]
            self.labels.add(label)
            for f in set(fields[1:]):
                # (label,f) tuple is feature 
                self.feats[(label, f)] += 1
            self.trainset.append(fields)
            
    def _initparams(self):
        self.size = len(self.trainset)
        
        self.M = max([len(record) - 1 for record in self.trainset]) # P91中的M
        
        # 计算P82页最下面的期望
        self.ep_ = [0.0] * len(self.feats)  # 保存期望值
        for i, f in enumerate(self.feats):
            self.ep_[i] = float(self.feats[f]) / float(self.size)
            # each feature function correspond to id
            self.feats[f] = i

        # 初始化需要学习的参数的值
        self.w = [0.0] * len(self.feats)
        self.lastw = self.w
        
        
    def probwgt(self, features, label):
        '''
                        辅助函数:计算P85中的公式6.22中的分子
        '''
        wgt = 0.0
        for f in features:
            print (self.feats[(label, f)])
            if (label, f)in self.feats:
                wgt += self.w[self.feats[(label, f)]]
        return math.exp(wgt)


    
    def calprob(self, features):
        '''
                        计算P85中的公式6.22的条件概率P(y|x)
        '''
        wgts = [(self.probwgt(features, label), label) for label in self.labels]
        Z = sum([ w for w, label in wgts])
        prob = [ (w / Z, label) for w, label in wgts]
        return prob 
    
                       
    def Ep(self):
        '''
                        计算P83页最上面的期望
        '''
        eps = [0.0] * len(self.feats)
        for record in self.trainset:
            features = record[1:]
            
            # 计算 p(y|x)
            probs = self.calprob(features)
            for f in features:
                for prob, label in probs:
                    if (label, f) in self.feats:     # only focus on features from training data.
                        idx = self.feats[(label, f)]
                        eps[idx] += prob * (1.0 / self.size) # 计算期望 sum(P(x) * P(y|x) * f(x,y))。 其中P(x) = 1 / N
        return eps
    
    def _convergence(self, lastw, w):
        for w1, w2 in zip(lastw, w):
            if abs(w1 - w2) >= 0.01:
                return False
        return True
                
    def train(self, max_iter=1000):
        self._initparams()
        for i in range(max_iter):
            print ('iter %d ...' % (i + 1))
            self.ep = self.Ep()           
            self.lastw = self.w[:]  
            for i, w in enumerate(self.w):
                delta = 1.0 / self.M * math.log(self.ep_[i] / self.ep[i])   # P91 公式6.34
                self.w[i] += delta
            
            # 是否满足收敛条件    
            if self._convergence(self.lastw, self.w):
                break

            
    def predict(self, input):
        features = input.strip().split()
        prob = self.calprob(features)
        prob.sort(reverse=True)
        return prob 

if __name__ == "__main__":
    maxent = MaxEnt()
    maxent.load_data("input.data")
    maxent.train(100)
    prob = maxent.predict("Sunny  Sad")
    print (prob)


GitHub上发现的一份最大熵模型实现代码。具体链接找不到了。


--结束END--

本文标题: python实现最大熵模型

本文链接: https://lsjlt.com/news/185029.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • python实现最大熵模型
    # encoding: utf-8 ''' Created on 2017-8-7 根据李航<<统计学习方法>>实现 ''' from collections import defaultdict import...
    99+
    2023-01-31
    模型 python
  • 建模笔记——熵权法(Python实现)
    一、模型介绍 熵权法是一种通过对已知数据的处理,从而获得影响因子权重的方法,其基本思路是根据指标变异性的大小来确定客观权重。 熵权法的优点在于其根据各项指标指标值的变异程度来确定指标权数的,是一种客观赋权法,避免了人为因素带来的偏差。相对那...
    99+
    2023-09-15
    python numpy 数据分析
  • Python实现最大堆(大顶堆)
    最大堆是指最大的元素在堆顶的堆。Python自带的heapq模块实现的是最小堆,没有提供最大堆的实现。虽然有些文章通过把元素取反再放入堆,出堆时再取反,把问题转换为最小堆问题也能间接实现最大堆,但是这样的实现只适合数值型的元素,不适合自定...
    99+
    2023-01-31
    大堆 Python 大顶堆
  • python三大模型与十大常用算法实例发现
    这篇文章主要介绍了python三大模型与十大常用算法实例发现的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python三大模型与十大常用算法实例发现文章都会有所收获,下面我们一起来看看吧。1 三大模型与十大常用...
    99+
    2023-07-02
  • 【算法——Python实现】最大堆和最小
    # _*_ encoding:utf-8 _*_ """ 最大堆 """ class MaxHeap(object): # def __init__(self): # self.data = [] # 创...
    99+
    2023-01-31
    算法 大堆 最小
  • python如何实现信息熵的计算代码
    小编给大家分享一下python如何实现信息熵的计算代码,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!Python的优点有哪些1、简单易用,与C/C++、Java、...
    99+
    2023-06-14
  • Python实现计算信息熵的示例代码
    目录一:数据集准备二:信息熵计算三:完整源码分享一:数据集准备 如博主使用的是: 多层感知机(MLP)实现考勤预测二分类任务(sklearn)对应数据集 导入至工程下 二:信息熵计...
    99+
    2022-12-26
    Python计算信息熵 Python 信息熵
  • 评价模型(一) 层次分析法(AHP),熵权法,TOPSIS分析 及其对应 PYTHON 实现代码和例题解释
    数学建模系列文章: 以下是个人在准备数模国赛时候的一些模型算法和代码整理,有空会不断更新内容: 评价模型(一)层次分析法(AHP),熵权法,TOPSIS分析 及其对应 PYTHON 实现代码和例题解释...
    99+
    2023-10-25
    数学建模
  • python Copula 实现绘制散点模型
    目录 一、使用copula生成合成数据集(synthetic dataset)1. 三维数据描述2. 使用高斯copula对数据集建模3. 使用拟合后的模型生成新的数据集5...
    99+
    2024-04-02
  • python的numpy模块实现逻辑回归模型
    使用python的numpy模块实现逻辑回归模型的代码,供大家参考,具体内容如下 使用了numpy模块,pandas模块,matplotlib模块 1.初始化参数 def initi...
    99+
    2024-04-02
  • Golang RabbitMQ: 实现大规模消息处理的最佳实践
    以下是使用Golang和RabbitMQ实现大规模消息处理的最佳实践:1. 使用连接池:在处理大量消息时,使用连接池可以提高性能。连...
    99+
    2023-10-20
    Golang
  • Python实现自动驾驶训练模型
    目录一、安装环境二、配置环境三、训练模型1、数据处理2、搭建模型3、运行结果四、总结 一、安装环境 gym是用于开发和比较强化学习算法的工具包,在python中安装gym库和其中子场...
    99+
    2024-04-02
  • LDA主题模型简介及Python实现
    一、LDA主题模型简介         LDA主题模型主要用于推测文档的主题分布,可以将文档集中每篇文档的主题以概率分布的形式给出根据主题进行主题聚类或文本分类。         LDA主题模型不关心文档中单词的顺序,通常使用词袋特征(ba...
    99+
    2023-09-04
    python 机器学习 自然语言处理
  • python groupby函数实现分组选取最大值与最小值
    现在需要将course分组,然后选择出每一组里面的最大值和最小值,并保留下来 实现下面数据结果: 直接使用groupby函数,不能直接达到此效果,需要在groupby函数上添加a...
    99+
    2024-04-02
  • 怎么用Python实现强大的 logging 模块
    本篇内容介绍了“怎么用Python实现强大的 logging 模块”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有...
    99+
    2024-04-02
  • python神经网络Keras GhostNet模型的实现
    目录什么是GhostNet模型GhostNet模型的实现思路1、Ghost Module2、Ghost Bottlenecks3、Ghostnet的构建GhostNet的代码构建1、...
    99+
    2024-04-02
  • 使用Python怎么实现一个ORM模型
    本篇文章为大家展示了使用Python怎么实现一个ORM模型,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。元类对于元类,我的理解其实也便较浅,大概是这个意思所有的类都是使用元类来进行创建的,而所有的类...
    99+
    2023-06-15
  • Python怎么实现RFM用户分析模型
    本篇内容介绍了“Python怎么实现RFM用户分析模型”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!看这篇文章前源数据长这样:学完后只要敲一...
    99+
    2023-06-16
  • 【AI】Python调用讯飞星火大模型接口,轻松实现文本生成
    随着chatGPT的出现,通用大模型已经成为了研究的热点,由于众所周知的原因,亚太地区调用经常会被禁,在国内,讯飞星火大模型是一个非常优秀的中文预训练模型。本文将介绍如何使用Python调用讯飞星火大...
    99+
    2023-09-12
    人工智能 python 开发语言
  • python解释模型库Shap实现机器学习模型输出可视化
    目录安装所需的库导入所需库创建模型创建可视化1、Bar Plot2、队列图3、热图4、瀑布图5、力图6、决策图解释一个机器学习模型是一个困难的任务,因为我们不知道这个模型在那个黑匣子...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作