python spark windows

python spark windows 2023-01-31 03:01:13 432人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

1、下载如下放在D盘添加 spark_HOME = D:\spark-2.3.0-bin-hadoop2.7。并将 %SPARK_HOME%/bin 添加至环境变量PATH。然后进入命令行，输入pyspark命令。若成功执行。则

1、下载如下
python spark windows pycharm pyspark环境配置

放在D盘
添加 spark_HOME = D:\spark-2.3.0-bin-hadoop2.7。

并将 %SPARK_HOME%/bin 添加至环境变量PATH。
然后进入命令行，输入pyspark命令。若成功执行。则成功设置环境变量

python spark windows pycharm pyspark环境配置

找到PyCharm sitepackage目录
python spark windows pycharm pyspark环境配置

右键点击即可进入目录，将上面D:\spark-2.3.0-bin-hadoop2.7里面有个/python/pyspark目录拷贝到上面的 sitepackage目录
python spark windows pycharm pyspark环境配置

安装 py4j
python spark windows pycharm pyspark环境配置

试验如下代码：

from __future__ import print_function
import sys
from operator import add
import os

# Path for spark source folder
os.environ['SPARK_HOME'] = "D:\spark-2.3.0-bin-hadoop2.7"
# Append pyspark to Python Path
sys.path.append("D:\spark-2.3.0-bin-hadoop2.7\python")
sys.path.append("D:\spark-2.3.0-bin-hadoop2.7\python\lib\py4j-0.9-src.zip")
from pyspark import SparkContext
from pyspark import SparkConf

if __name__ == '__main__':
    inputFile = "D:\Harry.txt"
    outputFile = "D:\Harry1.txt"
    sc = SparkContext()
    text_file = sc.textFile(inputFile)
    counts = text_file.flatMap(lambda line: line.split(' ')).map(lambda Word: (word, 1)).reduceByKey(lambda a, b: a + b)
    counts.saveAsTextFile(outputFile)

计算成功即可

您可能感兴趣的文档:

--结束END--

本文标题: python spark windows

本文链接: https://lsjlt.com/news/187305.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

python spark windows

1、下载如下放在D盘添加 SPARK_HOME = D:\spark-2.3.0-bin-hadoop2.7。并将 %SPARK_HOME%/bin 添加至环境变量PATH。然后进入命令行，输入pyspark命令。若成功执行。则...

99+

2023-01-31

python spark windows
spark入门框架+python

目录：简介 pyspark IPython Notebook 安装配置 spark编写框架：首先开启hdfs以及yarn 1 sparkconf 2 sparkcontext 3 RDD（核心） 4 transformation（核...

99+

2023-01-31

框架入门 spark
使用Python写spark 示例

个人GitHub地址： https://github.com/LinMingQiang 为什么要使用Python来写Spark Python写spark我认为唯一的理由就是：你要做数据挖掘，AI相关的工作。因为很多做数挖的他们的基...

99+

2023-01-31

示例 Python spark
spark编程python代码分析

今天小编给大家分享一下spark编程python代码分析的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。spark编程pyth...

99+

2023-07-05
python spark的特点有哪些

Python Spark的特点有以下几个：1. 高效性：Python Spark使用内存计算技术，能够在大数据处理过程中提供高速的计...

99+

2023-10-23

python
spark如何提交python程序

要提交Spark Python程序，可以使用spark-submit命令来执行Python脚本。下面是一个示例： spark-sub...

99+

2024-04-03

spark python
Python安装spark的详细过程

目录一.配置版本二.配置环境 1.配置JDK2.配置Spark3.配置Hadoop三.Pycharm配置spark四.使用anconda中python环境配置spark&n...

99+

2024-04-02
「Spark」Spark SQL Thrift Server运行方式

Spark SQL可以使用JDBC/ODBC或命令行接口充当分布式查询引擎。这种模式，用户或者应用程序可以直接与Spark SQL交互，以运行SQL查询，无需编写任何代码。Spark SQL提供两种方式来运行SQL：通过运行Thr...

99+

2021-02-24

「Spark」Spark SQL Thrift Server运行方式
大数据Hadoop之——Spark SQL+Spark Streaming

目录一、Spark SQL概述二、SparkSQL版本1）SparkSQL的演变之路2）shark与SparkSQL对比3）SparkSession三、RDD、DataFrames和DataSet1）三者关联关系1）RDD1、核心概念2、...

99+

2019-06-08

大数据Hadoop之——Spark SQL+Spark Streaming
spark集群更换python安装环境

由于需要用到很多第三方的包，比如numpy，pandas等，而生产环境又无法上网单个包安装太麻烦，因此考虑把之前安装的python的独立环境换成Anaconda的集成开发环境。以下是具体步骤： 1安装Anac...

99+

2023-01-31

集群环境 spark
windows下pycharm搭建spark环境并成功运行附源码

windows下spark的安装和运行建议看到这篇文章(描述非常详细) Spark在Win10下的环境搭建一、创建项目和.py文件二、在pycharm中添加spark环境 ...

99+

2024-04-02
理解Spark SQL(三）—— Spark SQL程序举例

上一篇说到，在Spark 2.x当中，实际上SQLContext和HiveContext是过时的，相反是采用SparkSession对象的sql函数来操作SQL语句的。使用这个函数执行SQL语句前需要先调用DataFrame的createO...

99+

2020-09-04

理解Spark SQL(三）—— Spark SQL程序举例
springboot集成spark并使用spark-sql的方法

这篇文章主要介绍“springboot集成spark并使用spark-sql的方法”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“springboot集成spark并使用spark-sql的方法”文章...

99+

2023-06-29
Spark Operator浅析

本文作者: 林武康(花名:知瑕),阿里巴巴计算平台事业部技术专家，Apache HUE Contributor, 参与了多个开源项目的研发工作，对于分布式系统设计应用有较丰富的经验，目前主要专注于EMR数据开发相关的产品的研发工作。 ...

99+

2017-07-26

Spark Operator浅析
Spark SQL(6) OptimizedPlan

Spark SQL(6) OptimizedPlan 在这一步spark sql主要应用一些规则，优化生成的Resolved Plan，这一步涉及到的有Optimizer。之前介绍在sparksession实例化的是会实例化session...

99+

2018-05-05

Spark SQL(6) OptimizedPlan 数据库入门数据库基础教程数据库 mysql
spark-sql-04-on_hive

设置metastore 机器： ke01、ke02、ke03、ke04 ke03 为元数据库 ke01、ke02、ke04 连接到元数据库、 hive-metastore搭建 ke03: hiv...

99+

2016-05-07

spark-sql-04-on_hive 数据库入门数据库基础教程数据库 mysql
Spark Streaming+Spark SQL的数据倾斜示例分析

这篇文章将为大家详细讲解有关Spark Streaming+Spark SQL的数据倾斜示例分析，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。1.现象三台机器都有产生executor，每台...

99+

2023-06-03
springboot集成spark并使用spark-sql的示例详解

首先添加相关依赖： <xml version="1.0" encoding="UTF-8"> <project xmlns="http://maven.apache...

99+

2024-04-02
windows python MySQL

问题表述： pip install MySQL-python==1.2.5出现如下报错： C:\Users\Administrator\AppData\Local\Programs\Common\Microsoft\Visual C++ f...

99+

2023-01-31

windows python MySQL
Python - windows - 隐

import ctypes whnd = ctypes.windll.kernel32.GetConsoleWindow() if whnd != 0: ctypes.windll.user32.ShowW...

99+

2023-01-31

Python windows