返回顶部
首页 > 资讯 > 精选 >IDEA如何开发配置SparkSQL
  • 127
分享到

IDEA如何开发配置SparkSQL

2023-06-20 20:06:07 127人浏览 八月长安
摘要

这篇文章将为大家详细讲解有关idea如何开发配置sparksql,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1.添加依赖在idea项目的pom.xml中添加依赖。<!--spark sq

这篇文章将为大家详细讲解有关idea如何开发配置sparksql,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

1.添加依赖

在idea项目的pom.xml中添加依赖。

<!--spark sql依赖,注意版本号--><dependency>    <groupId>org.apache.spark</groupId>    <artifactId>spark-sql_2.12</artifactId>    <version>3.0.0</version></dependency>

2.案例代码

package com.zf.bigdata.spark.sqlimport org.apache.spark.SparkConfimport org.apache.spark.rdd.RDDimport org.apache.spark.sql.{DataFrame, Dataset, Row, SparkSession}object Spark01_SparkSql_Basic {    def main(args: Array[String]): Unit = {        //创建上下文环境配置对象        val sparkConf = new SparkConf().setMaster("local[*]").setAppName("sparkSql")        //创建 SparkSession 对象        val spark = SparkSession.builder().config(sparkConf).getOrCreate()        // DataFrame        val df: DataFrame = spark.read.JSON("datas/user.json")        //df.show()        // DataFrame => Sql        //df.createOrReplaceTempView("user")        //spark.sql("select * from user").show()        //spark.sql("select age from user").show()        //spark.sql("select avg(age) from user").show()        //DataFrame => Dsl        //如果涉及到转换操作,转换需要引入隐式转换规则,否则无法转换,比如使用$提取数据的值        //spark 不是包名,是上下文环境对象名        import spark.implicits._        //df.select("age","username").show()        //df.select($"age"+1).show()        //df.select('age+1).show()        // DataSet        //val seq = Seq(1,2,3,4)        //val ds: Dataset[Int] = seq.toDS()        // ds.show()        // RDD <=> DataFrame        val rdd = spark.sparkContext.makeRDD(List((1,"张三",10),(2,"李四",20)))        val df1: DataFrame = rdd.toDF("id", "name", "age")        val rdd1: RDD[Row] = df1.rdd        // DataFrame <=> DataSet        val ds: Dataset[User] = df1.as[User]        val df2: DataFrame = ds.toDF()        // RDD <=> DataSet        val ds1: Dataset[User] = rdd.map {            case (id, name, age) => {                User(id, name = name, age = age)            }        }.toDS()        val rdd2: RDD[User] = ds1.rdd        spark.stop()    }    case class User(id:Int,name:String,age:Int)}

PS:下面看下在IDEA中开发Spark SQL程序

IDEA 中程序的打包和运行方式都和 SparkCore 类似,Maven 依赖中需要添加新的依赖项:

<dependency><groupId>org.apache.spark</groupId><artifactId>spark-sql_2.11</artifactId><version>2.1.1</version></dependency>

一、指定Schema格式

import org.apache.spark.sql.SparkSessionimport org.apache.spark.sql.types.StructTypeimport org.apache.spark.sql.types.StructFieldimport org.apache.spark.sql.types.IntegerTypeimport org.apache.spark.sql.types.StringTypeimport org.apache.spark.sql.Rowobject Demo1 {  def main(args: Array[String]): Unit = {    //使用Spark Session 创建表    val spark = SparkSession.builder().master("local").appName("UnderstandSparkSession").getOrCreate()    //从指定地址创建RDD    val personRDD = spark.sparkContext.textFile("D:\\tmp_files\\student.txt").map(_.split("\t"))    //通过StructType声明Schema    val schema = StructType(      List(        StructField("id", IntegerType),        StructField("name", StringType),        StructField("age", IntegerType)))    //把RDD映射到rowRDD    val rowRDD = personRDD.map(p=>Row(p(0).toInt,p(1),p(2).toInt))    val personDF = spark.createDataFrame(rowRDD, schema)    //注册表    personDF.createOrReplaceTempView("t_person")    //执行SQL    val df = spark.sql("select * from t_person order by age desc limit 4")    df.show()    spark.stop()  }}

二、使用case class

import org.apache.spark.sql.SparkSession//使用case classobject Demo2 {  def main(args: Array[String]): Unit = {    //创建SparkSession    val spark = SparkSession.builder().master("local").appName("CaseClassDemo").getOrCreate()    //从指定的文件中读取数据,生成对应的RDD    val lineRDD = spark.sparkContext.textFile("D:\\tmp_files\\student.txt").map(_.split("\t"))    //将RDD和case class 关联    val studentRDD = lineRDD.map( x => Student(x(0).toInt,x(1),x(2).toInt))    //生成 DataFrame,通过RDD 生成DF,导入隐式转换    import spark.sqlContext.implicits._    val studentDF = studentRDD.toDF    //注册表 视图    studentDF.createOrReplaceTempView("student")    //执行SQL    spark.sql("select * from student").show()    spark.stop()  }}//case class 一定放在外面case class Student(stuID:Int,stuName:String,stuAge:Int)

三、把数据保存到数据库

import org.apache.spark.sql.types.IntegerTypeimport org.apache.spark.sql.types.StringTypeimport org.apache.spark.sql.SparkSessionimport org.apache.spark.sql.types.StructTypeimport org.apache.spark.sql.types.StructFieldimport org.apache.spark.sql.Rowimport java.util.Propertiesobject Demo3 {  def main(args: Array[String]): Unit = {    //使用Spark Session 创建表    val spark = SparkSession.builder().master("local").appName("UnderstandSparkSession").getOrCreate()    //从指定地址创建RDD    val personRDD = spark.sparkContext.textFile("D:\\tmp_files\\student.txt").map(_.split("\t"))    //通过StructType声明Schema    val schema = StructType(      List(        StructField("id", IntegerType),        StructField("name", StringType),        StructField("age", IntegerType)))    //把RDD映射到rowRDD    val rowRDD = personRDD.map(p => Row(p(0).toInt, p(1), p(2).toInt))    val personDF = spark.createDataFrame(rowRDD, schema)    //注册表    personDF.createOrReplaceTempView("person")    //执行SQL    val df = spark.sql("select * from person ")    //查看SqL内容    //df.show()    //将结果保存到mysql中    val props = new Properties()    props.setProperty("user", "root")    props.setProperty("passWord", "123456")    props.setProperty("driver", "com.Mysql.jdbc.Driver")    df.write.mode("overwrite").jdbc("jdbc:mysql://localhost:3306/company?serverTimezone=UTC&characterEncoding=utf-8", "student", props)    spark.close()  }}

关于“IDEA如何开发配置SparkSQL”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

--结束END--

本文标题: IDEA如何开发配置SparkSQL

本文链接: https://lsjlt.com/news/300104.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • IDEA如何开发配置SparkSQL
    这篇文章将为大家详细讲解有关IDEA如何开发配置SparkSQL,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1.添加依赖在idea项目的pom.xml中添加依赖。<!--spark sq...
    99+
    2023-06-20
  • IDEA 开发配置SparkSQL及简单使用案例代码
    1.添加依赖 在idea项目的pom.xml中添加依赖。 <!--spark sql依赖,注意版本号--> <dependency> <gr...
    99+
    2024-04-02
  • idea如何配置javaweb开发环境
    要配置JavaWeb开发环境,您需要完成以下步骤:1. 安装Java Development Kit (JDK):从Oracle官网...
    99+
    2023-09-21
    idea javaweb
  • idea开发环境配置
    最近,由于电脑重装系统了。因此需要将开发环境从新配置一遍,仅此记录安装过程。 目录 一、idea的安装及其激活 二、.jdk环境的配置  三、tomcat的下载安装 1.下载tomcat并配置环境变量 2.启动tomcat 3.访问tomc...
    99+
    2023-10-26
    intellij-idea java ide
  • Idea如何配置CheckStyle
    一、CheckStyle简介 CheckStyle是SourceForge下的一个项目,提供了一个帮助JAVA开发人员遵守某些编码规范的工具。它能够自动化代码规范检查过程,从而使得开发人员从这项重要但...
    99+
    2023-09-22
    intellij-idea java maven
  • IDEA如何配置Tomcat
    一、使用IDEA配置Tomcat的步骤 1、在IDEA右上角的项目运行列表中选中 Edit Configurations  2、进入新的窗口点击"+"  3、找到Toncat Server中的Local进行点击  4、配置Tomcat...
    99+
    2023-09-08
    intellij-idea java ide
  • 如何配置一个IDEA-Maven开放环境
    本篇文章给大家分享的是有关如何配置一个IDEA-Maven开放环境,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。一、Maven的下载点击进入往期的下载地址:http://www...
    99+
    2023-05-31
    idea maven
  • IDEA中如何配置Git?
    目录 一、下载git 二、在IDEA中配置git 三、结束语 一、下载git 进入git的官网:https://git-scm.com/,点击Download。 点击Download for Windows。   3、选择对应的版本...
    99+
    2023-09-21
    git idea
  • idea中tomcat如何配置
    要配置Tomcat,您可以按照以下步骤进行操作:1. 下载Tomcat:前往Apache Tomcat官方网站(https://to...
    99+
    2023-08-30
    idea tomcat
  • idea中如何配置tomcat
    目录1.先安装Tomcat2.配置环境变量3.idea配置Tomcat总结1.先安装Tomcat 1).先安装Tomcat Tomcat下载地址 2).下载后解压 3).点击st...
    99+
    2023-03-07
    idea配置tomcat idea tomcat idea tomcat配置
  • idea如何打开运行配置java web项目
    idea如何打开java web项目并运行,本次以Servlet项目为例 首先,点击File->open,选择要运行的java web项目,选择项目之后点击ok,如果弹出弹出框,可以选择当前窗口Thsi window或者New wind...
    99+
    2023-08-31
    servlet java 开发语言
  • 如何配置Flutter+Idea环境
    这篇文章主要介绍了如何配置Flutter+Idea环境,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。安装Flutter SDK首先下载官方文档中 flutter_window...
    99+
    2023-06-21
  • idea如何配置tomcat项目
    配置Tomcat项目需要以下步骤: 下载和安装Tomcat服务器:首先需要下载Tomcat服务器,并按照官方文档中的指导进行安装...
    99+
    2024-04-08
    idea tomcat
  • idea如何配置jdk和maven
    配置JDK和Maven主要是为了在开发过程中能够使用Java和Maven的功能。以下是配置JDK和Maven的步骤: 下载和安装...
    99+
    2024-04-08
    maven idea jdk
  • php开发环境如何配置
    要配置PHP开发环境,您需要执行以下步骤:1. 安装PHP:从PHP官方网站(https://www.php.net/downloa...
    99+
    2023-09-05
    php
  • 如何配置Kotlin开发环境
    本篇文章为大家展示了如何配置Kotlin开发环境,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。Kotlin是一种开源的基于JVM的变成语言,由JetBeans公司开发(大概除了使用VS的.net开发...
    99+
    2023-05-31
    kotlin
  • idea如何同步所有配置
    小编给大家分享一下idea如何同步所有配置,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!intellij idea同步所有配置【导入或导出所有配置】IDEA版本:...
    99+
    2023-06-20
  • IDEA中如何配置安装node.js
    这篇文章主要讲解了“IDEA中如何配置安装node.js”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“IDEA中如何配置安装node.js”吧!idea中支持运行很多种编程语言,只需要在电脑...
    99+
    2023-07-04
  • 如何使用IntelliJ IDEA配置Maven
    小编给大家分享一下如何使用IntelliJ IDEA配置Maven,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1. 什么是 Maven,为什么要使用 Maven...
    99+
    2023-05-30
    intellij idea maven
  • IDEA中如何配置Node环境
    这篇文章主要介绍了IDEA中如何配置Node环境的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇IDEA中如何配置Node环境文章都会有所收获,下面我们一起来看看吧。一、下载Node.js官网下载链接:Node....
    99+
    2023-07-05
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作