首页 > 资讯 > 后端开发 > Python >Python中常见的科学类库怎么用

121

分享到

Python中常见的科学类库怎么用

2023-06-27 12:06:00 121人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要介绍“python中常见的科学类库怎么用”，在日常操作中，相信很多人在Python中常见的科学类库怎么用问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Python中常见的科学类库怎么用”的疑惑有所

这篇文章主要介绍“python中常见的科学类库怎么用”，在日常操作中，相信很多人在Python中常见的科学类库怎么用问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Python中常见的科学类库怎么用”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

Wget

提取数据，尤其是从网络中提取数据，是数据科学家的重要任务之一。Wget 是一个免费的工具，用于从网络上非交互式下载文件。它支持 Http、https 和 FTP 协议，以及通过 HTTP 代理进行访问。因为它是非交互式的，所以即使用户没有登录，它也可以在后台工作。所以下次你想下载一个网站或者网页上的所有图片，wget 会提供帮助。

安装：

$ pip install wget

例子：

import wgeturl = 'http://www.futurecrew.com/skaven/song_files/mp3/razorback.mp3'filename = wget.download(url)100% [................................................] 3841532 / 3841532filename'razorback.mp3'

钟摆

对于在 Python 中处理日期时间感到沮丧的人来说， Pendulum 库是很有帮助的。这是一个 Python 包，可以简化日期时间操作。它是 Python 原生类的一个替代品。有关详细信息，请参阅其文档。

安装：

$ pip install pendulum

例子：

import pendulumdt_toronto = pendulum.datetime(2012, 1, 1, tz='America/Toronto')dt_vancouver = pendulum.datetime(2012, 1, 1, tz='America/Vancouver')print(dt_vancouver.diff(dt_toronto).in_hours())3

不平衡学习

当每个类别中的样本数几乎相同（即平衡）时，大多数分类算法会工作得最好。但是现实生活中的案例中充满了不平衡的数据集，这可能会影响到机器学习算法的学习和后续预测。幸运的是，imbalanced-learn 库就是为了解决这个问题而创建的。它与 scikit-learn 兼容，并且是 scikit-learn-contrib 项目的一部分。下次遇到不平衡的数据集时，可以尝试一下。

安装：

pip install -U imbalanced-learn# orconda install -c conda-forge imbalanced-learn

例子：

有关用法和示例，请参阅其文档。

FlashText

在自然语言处理（NLP）任务中清理文本数据通常需要替换句子中的关键词或从句子中提取关键词。通常，这种操作可以用正则表达式来完成，但是如果要搜索的术语数达到数千个，它们可能会变得很麻烦。

Python 的 FlashText 模块，基于 FlashText 算法，为这种情况提供了一个合适的替代方案。FlashText 的最佳部分是运行时间与搜索项的数量无关。你可以在其文档中读到更多关于它的信息。

安装：

$ pip install flashtext

例子：

提取关键词：

from flashtext import KeyWordProcessorkeyword_processor = KeywordProcessor()# keyword_processor.add_keyword(, )keyword_processor.add_keyword('Big Apple', 'New York')keyword_processor.add_keyword('Bay Area')keywords_found = keyword_processor.extract_keywords('I love Big Apple and Bay Area.')keywords_found['New York', 'Bay Area']

替代关键词：

keyword_processor.add_keyword('New Delhi', 'NCR region')new_sentence = keyword_processor.replace_keywords('I love Big Apple and new delhi.')new_sentence'I love New York and NCR region.'

有关更多示例，请参阅文档中的用法一节。

模糊处理

这个名字听起来很奇怪，但是 FuzzyWuzzy 在字符串匹配方面是一个非常有用的库。它可以很容易地实现字符串匹配率、令牌匹配率等操作。对于匹配保存在不同数据库中的记录也很方便。

安装：

$ pip install fuzzywuzzy

例子：

from fuzzywuzzy import fuzzfrom fuzzywuzzy import process# 简单的匹配率fuzz.ratio("this is a test", "this is a test!")97# 部分的匹配率 fuzz.partial_ratio("this is a test", "this is a test!") 100

更多的例子可以在 FuzzyWuzy 的 GitHub 仓库得到。

PyFlux

时间序列分析是机器学习中最常遇到的问题之一。PyFlux 是 Python 中的开源库，专门为处理时间序列问题而构建的。该库拥有一系列优秀的现代时间序列模型，包括但不限于 ARIMA、GARCH 以及 VAR 模型。简而言之，PyFlux 为时间序列建模提供了一种概率方法。这值得一试。

安装：

pip install pyflux

例子：

有关用法和示例，请参阅其文档。

IPyvolume

交流结果是数据科学的一个重要方面，可视化结果提供了显著优势。 IPyvolume 是一个 Python 库，用于在 Jupyter 笔记本中可视化 3D 体积和形状（例如 3D 散点图），配置和工作量极小。然而，它目前处于 1.0 之前的阶段。一个很好的类比是这样的: IPyVolumee volshow 是 3D 阵列，Matplotlib 的 imshow 是 2D 阵列。你可以在其文档中读到更多关于它的信息。

安装：

Using pip$ pip install ipyvolumeConda/Anaconda$ conda install -c conda-forge ipyvolume

例子：

动画：

体绘制：

Dash

Dash 是一个用于构建 WEB 应用程序的高效 Python 框架。它构建于 flask、Plotty.js 和 Response.js 之上，将下拉菜单、滑块和图形等流行 UI 元素与你的 Python 分析代码联系起来，而不需要javascript。Dash 非常适合构建可在 Web 浏览器中呈现的数据可视化应用程序。有关详细信息，请参阅其用户指南。

安装：

pip install dash==0.29.0  # The core dash backendpip install dash-html-components==0.13.2  # HTML componentspip install dash-core-components==0.36.0  # Supercharged componentspip install dash-table==3.1.3  # Interactive DataTable component (new!)

例子：

下面的示例显示了一个具有下拉功能的高度交互的图表。当用户在下拉列表中选择一个值时，应用程序代码将数据从 Google Finance 动态导出到 pandas 数据框架中。

Gym

从 Openai 而来的 Gym 是开发和比较强化学习算法的工具包。它与任何数值计算库兼容，如 Tensorflow 或 Theano。Gym 是一个测试问题的集合，也称为“环境”，你可以用它来制定你的强化学习算法。这些环境有一个共享的接口，允许您编写通用算法。

安装：

pip install gym

例子：

以下示例将在 CartPole-v0 环境中，运行 1000 次，在每一步渲染环境。

你可以在 Gym 网站上读到其它的环境。

到此，关于“Python中常见的科学类库怎么用”的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注编程网网站，小编会继续努力为大家带来更多实用的文章！

您可能感兴趣的文档:

--结束END--

本文标题: Python中常见的科学类库怎么用

本文链接: https://lsjlt.com/news/310808.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Python中常见的科学类库怎么用

Wget

钟摆

不平衡学习

FlashText

模糊处理

PyFlux

IPyvolume

Dash

Gym

Python中常见的科学类库怎么用

python科学计算常用的数学科学计算库是什么

常用的Python数据科学库有哪些

常用数据科学Python库有哪些

Python中最受欢迎的科学类库有哪些

Python数据科学Matplotlib图库的用法

实用的数据科学Python库有什么功能

怎么将Scikit-learn Python库用于数据科学项目

有哪些实用的数据科学Python库

数据科学领域常用的Python包有哪些

python学习中常见的误区有哪些

SQL数据库中常见的数据类型有什么

Python常见库matplotlib学习笔记之画图文字的中文显示

怎么使用Python进行数据科学研究

学习Python常用的库有哪些

Python CPython 在机器学习和数据科学中的应用

深入了解Python中常见的数据类型

数据科学家在使用Python时常犯的九个错误

react常见的ts类型怎么定义

Oracle数据库中常见的数据类型有哪些？

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义