返回顶部
首页 > 资讯 > 后端开发 > Python >怎么使用Python构建电影推荐系统
  • 320
分享到

怎么使用Python构建电影推荐系统

2023-07-06 01:07:26 320人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要讲解了“怎么使用python构建电影推荐系统”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python构建电影推荐系统”吧!导入数据导入和合并数据集并创建 pandas

这篇文章主要讲解了“怎么使用python构建电影推荐系统”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python构建电影推荐系统”吧!

导入数据

导入和合并数据集并创建 pandas DataFrame

MovieLens 20M 数据集自 1995 年以来超过 2000 万的电影评级和标记活动。

# usecols 允许选择自己选择的特征,并通过dtype设定对应类型movies_df=pd.read_csv('movies.csv', usecols=['movieId','title'], dtype={'movieId':'int32','title':'str'})movies_df.head()

怎么使用Python构建电影推荐系统

ratings_df=pd.read_csv('ratings.csv', usecols=['userId', 'movieId', 'rating','timestamp'], dtype={'userId': 'int32', 'movieId': 'int32', 'rating': 'float32'})ratings_df.head()

怎么使用Python构建电影推荐系统

检查是否存在任何空值以及两个数据中的条目数。

# 检查缺失值movies_df.isnull().sum()

movieId 0

title 0

dtype: int64

ratings_df.isnull().sum()

userId 0

movieId 0

rating 0

timestamp 0

dtype: int64

print("Movies:",movies_df.shape)print("Ratings:",ratings_df.shape)

Movies: (9742, 2)

Ratings: (100836, 4)

合并列上的数据帧 'movieId'

# movies_df.info()# ratings_df.info()movies_merged_df=movies_df.merge(ratings_df, on='movieId')movies_merged_df.head()

怎么使用Python构建电影推荐系统

现在已经成功合并了导入的数据集。

添加衍生特征

添加必要的特征来分析数据。

通过按电影标题对用户评分进行分组来创建'Average Rating' & 'Rating Count'列。

movies_average_rating=movies_merged_df.groupby('title')['rating'] .mean().sort_values(ascending=False).reset_index().rename(columns={'rating':'Average Rating'})movies_average_rating.head()

怎么使用Python构建电影推荐系统

movies_rating_count=movies_merged_df.groupby('title')['rating'].count().sort_values(ascending=True) .reset_index().rename(columns={'rating':'Rating Count'}) #ascending=Falsemovies_rating_count_avg=movies_rating_count.merge(movies_average_rating, on='title')movies_rating_count_avg.head()

怎么使用Python构建电影推荐系统

目前已经创建了 2 个新的衍生特征。

数据可视化

使用 Seaborn 可视化数据:

  • 经过分析发现,许多电影在近 10 万用户评分的数据集上都有完美的 5 星平均评分。这表明存在异常值,我们需要通过可视化进一步确认。

  • 多部电影的评分比较单一,建议设置一个评分门槛值,以便产生有价值的推荐。

使用 seaborn & matplotlib 可视化数据,以便更好地观察和分析数据。

将新创建的特征绘制直方图,并查看它们的分布。设置 bin 大小为80,该值的设置需要具体分析,并合理设置。

# 导入可视化库import seaborn as snsimport matplotlib.pyplot as pltsns.set(font_scale = 1)plt.rcParams["axes.grid"] = Falseplt.style.use('dark_background')%matplotlib inline# 绘制图形plt.figure(figsize=(12,4))plt.hist(movies_rating_count_avg['Rating Count'],bins=80,color='tab:purple')plt.ylabel('Ratings Count(Scaled)', fontsize=16)plt.savefig('ratinGCounthist.jpg')plt.figure(figsize=(12,4))plt.hist(movies_rating_count_avg['Average Rating'],bins=80,color='tab:purple')plt.ylabel('Average Rating',fontsize=16)plt.savefig('avgratinghist.jpg')

怎么使用Python构建电影推荐系统

图1 Average Rating直方图

怎么使用Python构建电影推荐系统

图2 Rating Count的直方图

现在创建一个joinplot二维图表,将这两个特征一起可视化。

plot=sns.jointplot(x='Average Rating', y='Rating Count', data=movies_rating_count_avg, alpha=0.5,  color='tab:pink')plot.savefig('joinplot.jpg')

怎么使用Python构建电影推荐系统

Average Rating和Rating Count的二维图

分析
  • 图1证实了,大部分电影的评分都是较低的。除了设置阈值之外,我们还可以在这个用例中使用一些更高百分比的分位数。

  • 直方图 2 展示了“Average Rating”的分布函数。

数据清洗

运用describe()函数得到数据集的描述统计值,如分位数和标准差等。

pd.set_option('display.float_fORMat', lambda x: '%.3f' % x)print(rating_with_RatingCount['Rating Count'].describe())
count 100836.000mean58.759std 61.965min1.00025% 13.00050% 39.00075% 84.000max329.000Name: Rating Count, dtype: float64

设置阈值并筛选出高于阈值的数据。

popularity_threshold = 50popular_movies= rating_with_RatingCount[rating_with_RatingCount['Rating Count']>=popularity_threshold]popular_movies.head()# popular_movies.shape

怎么使用Python构建电影推荐系统

至此已经通过过滤掉了评论低于阈值的电影来清洗数据。

创建数据透视表

创建一个以用户为索引、以电影为列的数据透视表

为了稍后将数据加载到模型中,需要创建一个数据透视表。并设置'title'作为索引,'userId'为列,'rating'为值。

import osmovie_features_df=popular_movies.pivot_table(index='title',columns='userId',values='rating').fillna(0)movie_features_df.head()movie_features_df.to_excel('output.xlsx')

怎么使用Python构建电影推荐系统

接下来将创建的数据透视表加载到模型。

建立 kNN 模型

建立 kNN 模型并输出与每部电影相似的 5 个推荐

使用scipy.sparse模块中的csr_matrix方法,将数据透视表转换为用于拟合模型的数组矩阵。

from scipy.sparse import csr_matrixmovie_features_df_matrix = csr_matrix(movie_features_df.values)

最后,使用之前生成的矩阵数据,来训练来自sklearn中的NearestNeighbors算法。并设置参数:metric = 'cosine', alGorithm = 'brute'

from sklearn.neighbors import NearestNeighborsmodel_knn = NearestNeighbors(metric = 'cosine', algorithm = 'brute')model_knn.fit(movie_features_df_matrix)

现在向模型传递一个索引,根据'kneighbors'算法要求,需要将数据转换为单行数组,并设置n_neighbors的值。

query_index = np.random.choice(movie_features_df.shape[0])distances, indices = model_knn.kneighbors(movie_features_df.iloc[query_index,:].values.reshape(1, -1),n_neighbors = 6)

最后在 query_index 中输出出电影推荐。

for i in range(0, len(distances.flatten())):if i == 0:print('Recommendations for {0}:n'.format(movie_features_df.index[query_index]))else:print('{0}: {1}, with distance of {2}:'.format(i, movie_features_df.index[indices.flatten()[i]],distances.flatten()[i]))
Recommendations for Harry Potter and the Order of the Phoenix (2007):1: Harry Potter and the Half-Blood Prince (2009), with distance of 0.2346513867378235:2: Harry Potter and the Order of the Phoenix (2007), with distance of 0.3396233320236206:3: Harry Potter and the Goblet of Fire (2005), with distance of 0.4170845150947571:4: Harry Potter and the Prisoner of Azkaban (2004), with distance of 0.4499547481536865:5: Harry Potter and the Chamber of Secrets (2002), with distance of 0.4506162405014038:

感谢各位的阅读,以上就是“怎么使用Python构建电影推荐系统”的内容了,经过本文的学习后,相信大家对怎么使用Python构建电影推荐系统这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

--结束END--

本文标题: 怎么使用Python构建电影推荐系统

本文链接: https://lsjlt.com/news/357221.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 怎么使用Python构建电影推荐系统
    这篇文章主要讲解了“怎么使用Python构建电影推荐系统”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python构建电影推荐系统”吧!导入数据导入和合并数据集并创建 Pandas ...
    99+
    2023-07-06
  • 使用Python构建电影推荐系统
    在日常数据挖掘工作中,除了会涉及到使用Python处理分类或预测任务,有时候还会涉及推荐系统相关任务。推荐系统用于各个领域,常见的例子包括视频和音乐服务的播放列表生成器、在线商店的产品推荐器或社交媒体平台的内容推荐器。在这个项目中,我们创建...
    99+
    2023-05-14
    数据 Python 推荐系统
  • PHP在网络电影推荐系统开发中的应用
    PHP在网络电影推荐系统开发中的应用随着互联网技术的不断发展,越来越多的人开始使用网络观看电影。而在海量电影资源之中,想要找到符合自己口味的电影并不容易。为了解决这个问题,许多电影推荐系统应运而生。其中,PHP作为一种使用广泛的服务器端脚本...
    99+
    2023-10-27
    包括电影信息
  • 如何在Python中构建一个简单的推荐系统
    如何在Python中构建一个简单的推荐系统推荐系统是为了帮助人们发现和选择他们可能感兴趣的物品而设计的。Python提供了丰富的库和工具,可以帮助我们构建一个简单但有效的推荐系统。本文将介绍如何使用Python构建一个基于用户的协同过滤推荐...
    99+
    2023-10-22
    Python 推荐系统 构建
  • 如何利用ChatGPT和Python实现智能推荐系统的构建
    如何利用ChatGPT和Python实现智能推荐系统的构建推荐系统是目前互联网应用中广泛使用的一种技术,它能根据用户的兴趣和行为数据,为用户推荐个性化的内容和产品。ChatGPT是一种基于人工智能的机器学习模型,专注于对话生成。结合Chat...
    99+
    2023-10-27
    ChatGPT Python 智能推荐系统
  • 如何使用ChatGPT PHP构建智能音乐推荐聊天系统
    如何使用ChatGPT PHP构建智能音乐推荐聊天系统引言:随着人工智能的不断发展,智能音乐推荐系统成为了许多音乐爱好者的必备工具。本文将介绍如何使用ChatGPT PHP构建一个智能音乐推荐聊天系统,并提供具体的代码示例。第一部分:Cha...
    99+
    2023-10-27
    ChatGPT PHP 智能音乐推荐
  • 推荐系统MostPopular算法的Python怎么实现
    今天小编给大家分享一下推荐系统MostPopular算法的Python怎么实现的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。...
    99+
    2023-07-02
  • Python 机器学习项目实战:教你构建一个智能推荐系统
    智能推荐系统是一种广泛应用于电子商务、流媒体和社交媒体等领域的推荐算法。其目的是为用户提供个性化的推荐结果,提高用户的满意度和参与度。智能推荐系统通常基于机器学习技术,通过分析用户的历史行为数据,来学习用户的兴趣和偏好。然后,系统根据这...
    99+
    2024-02-14
    Python 机器学习 推荐系统 智能推荐 系统原理
  • 异步协程开发指南:构建高性能的推荐系统
    随着互联网及移动互联网的快速发展,数据量呈爆炸式增长,如何高效处理数据成为了各大公司研发团队面对的一个重要问题。推荐系统是其中的一个关键应用领域,在众多企业中有着广泛的应用。而异步协程是一个在高并发场景下实现高性能数据处理的重要技术,本文将...
    99+
    2023-12-17
    推荐系统 异步 协程
  • 利用Python实现电影订票系统
    目录一、效果展示二、整体结构图 三、代码分解3.1infos.py 3.2seat_book.py3.3film_selector.py3.4main....
    99+
    2024-04-02
  • 利用python构建Mock系统
    之前的一篇博文提到过利用打算利用python写个mock系统以方便测试,主要是因为所测系统A依赖于其他系统的输入,两个系统属于不同的项目且开发和测试成员都不同,单独针对A系统进行测试时由于A的依赖性导致很多测试点无法覆盖且由于分属不同项目联...
    99+
    2023-01-31
    系统 python Mock
  • 电脑影子系统怎么退出
    今天小编给大家分享一下电脑影子系统怎么退出的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。影子系统退出方法双击影子系统图标打开...
    99+
    2023-07-01
  • 如何使用MySQL和Java实现一个简单的电影推荐功能
    如何使用MySQL和Java实现一个简单的电影推荐功能近年来,随着互联网和大数据的普及,电影推荐功能成为很多影视平台的重要组成部分。通过分析用户的喜好和行为,可以精准地推荐给用户适合的电影,提升用户体验和平台的活跃度。本文将介绍如何使用My...
    99+
    2023-10-22
    MySQL Java 电影推荐
  • 如何使用Redis和Swift开发推荐系统功能
    如何使用Redis和Swift开发推荐系统功能在当今互联网时代,推荐系统已经成为许多应用的核心功能之一。无论是电商平台、社交网络还是音乐视频网站,都广泛使用推荐系统来提供个性化的推荐内容,帮助用户发现并获取他们可能感兴趣的内容。要实现一个高...
    99+
    2023-10-22
    推荐系统 Swift redis
  • 如何使用Redis和Perl开发推荐系统功能
    如何使用Redis和Perl开发推荐系统功能推荐系统是现代互联网应用中非常重要的一部分,它可以帮助用户发现他们可能感兴趣的内容或产品。在本文中,我们将介绍如何使用Redis和Perl开发一个简单的推荐系统功能,并提供具体的代码示例。首先,让...
    99+
    2023-10-22
    推荐系统 redis Perl
  • 如何使用Go语言和Redis实现推荐系统
    如何使用Go语言和Redis实现推荐系统推荐系统是现代互联网平台中重要的一环,它帮助用户发现和获取感兴趣的信息。而Go语言和Redis是两个非常流行的工具,它们在实现推荐系统的过程中能够发挥重要作用。本文将介绍如何使用Go语言和Redis来...
    99+
    2023-10-27
    推荐系统 Go语言 redis
  • 怎么使用Python构建GUI
    本篇内容介绍了“怎么使用Python构建GUI”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Streamlit我喜欢使用的包是 Stream...
    99+
    2023-07-06
  • 电脑影子系统pe怎么删除
    本篇内容介绍了“电脑影子系统pe怎么删除”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!影子系统pe删除方法使用winPE在PE模式下进行操作...
    99+
    2023-07-01
  • springboot基于JAVA的电影推荐系统的开发与实现 附源码-毕业设计112306
                                                               目    录 摘  要 4 Abstract 5 第1章  前  言 6 1.1  研究背景 6 ...
    99+
    2023-09-03
    java spring boot python android php
  • (附源码)springboot基于JAVA的电影推荐系统的开发与实现 毕业设计112306
    目 录 摘 要 4 Abstract 5 第1章 前 言 6 1.1 研究背景 6 1.2 研究现状 6 1.3 系统开发目标 6 第2章 技术与原理 8 2.1 JSP介绍 8 2.2 JAVA技术 8 ...
    99+
    2023-09-01
    spring boot python php android java Powered by 金山文档
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作