首页
教程
问答社区
new
标签库
开发文档
最新
工具箱
立即登录
免费注册
扫码关注官方微信
扫码下载APP
返回顶部
首页
>
标签库
>
理解Spark
当前位置:#理解Spark#
扫描二维码
关注官方微信号获取第一手资料
数据库
2020-09-04
理解Spark SQL(三)—— Spark SQL程序举例
上一篇说到,在Spark 2.x当中,实际上SQLContext和HiveContext是过时的,相反是采用SparkSession对象的sql函数来操作SQL语句的。使用这个函数执行SQL语句前需要先调用DataFrame的createOrReplaceTe...
668
标签:
理解Spark
SQL(三)——
Spark
SQL程序举例
数据库
2021-12-29
Spark中Broadcast的理解
广播变量应用场景:在提交作业后,task在执行的过程中,有一个或多个值需要在计算的过程中多次从Driver端拿取时,此时会必然会发生大量的网络IO,这时,最好用广播变量的方式,将Driver端的变量的值事先广播到每一个Worker端,以后再计算过程中只需要从本...
530
标签:
Spark中Broadcast的理解
数据库
2017-01-02
理解Spark SQL(一)—— CLI和ThriftServer
Spark SQL主要提供了两个工具来访问hive中的数据,即CLI和ThriftServer。前提是需要Spark支持Hive,即编译Spark时需要带上hive和hive-thriftserver选项,同时需要确保在$SPARK_HOME/conf目录下有...
726
标签:
理解Spark
SQL(一)——
CLI和ThriftServer
数据库
2017-07-25
理解Spark SQL(二)—— SQLContext和HiveContext
使用Spark SQL,除了使用之前介绍的方法,实际上还可以使用SQLContext或者HiveContext通过编程的方式实现。前者支持SQL语法解析器(SQL-92语法),后者支持SQL语法解析器和HiveSQL语法解析器,默认为HiveSQL语法解析器,...
721
标签:
理解Spark
SQL(二)——
SQLContext和HiveContext
精选
2023-06-02
怎样理解Spark的基本原理
怎样理解Spark的基本原理,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1Spark优势特点作为大数据计算框架 MapReduce 的继任者,Spark 具备以下优势特性...
395
标签:
精选
2023-06-02
怎么进行Spark in action on Kubernetes - Spark Operator的原理解析
怎么进行Spark in action on Kubernetes - Spark Operator的原理解析,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。前言...
955
标签:
数据库
2020-11-26
理解Spark运行模式(二)(Yarn Cluster)
上一篇说到Spark的yarn client运行模式,它与yarn cluster模式的主要区别就是前者Driver是运行在客户端,后者Driver是运行在yarn集群中。yarn client模式一般用在交互式场景中,比如spark shell, spark...
792
标签:
理解Spark运行模式(二)(Yarn
Cluster)
数据库
2021-12-17
理解Spark运行模式(一)(Yarn Client)
Spark运行模式有Local,STANDALONE,YARN,MESOS,KUBERNETES这5种,其中最为常见的是YARN运行模式,它又可分为Client模式和Cluster模式。这里以Spark自带的SparkPi来说明这些运行模式。本文作为第一篇,先...
754
标签:
理解Spark运行模式(一)(Yarn
Client)
数据库
2019-06-05
Spark内存管理
1、spark的一大特性就是基于内存计算,Driver只保存任务的宏观性的元数据,数据量较小,且在执行过程中基本不变,不做重点分析,而真正的计算任务Task分布在各个Executor中,其中的内存数据量大,且会随着计算的进行会发生实时变化,所以Executor...
379
标签:
Spark内存管理
精选
2023-06-02
怎么理解spark的自定义分区和排序及spark与jdbc
这篇文章将为大家详细讲解有关怎么理解spark的自定义分区和排序及spark与jdbc,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。//自定义分区import org.apache.spar...
235
标签:
数据库
2024-04-02
如何理解Spark中的核心概念RDD
...
907
标签:
Python
2024-04-02
springboot集成spark并使用spark-sql的示例详解
...
210
标签:
精选
2023-06-02
怎么理解spark的计算器与广播变量
这篇文章给大家介绍怎么理解spark的计算器与广播变量,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。一.计算器1.官网2.解释计数器只支持加,计算器字task里面3.测试4.结果截图WEBUI4.应用场景数据很多有的数...
556
标签:
精选
2023-06-02
如何解析Apache Spark 统一内存管理模型
今天就跟大家聊聊有关如何解析Apache Spark 统一内存管理模型,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。Apache Spark 统一内存管理模型详解下面将对 Spark...
152
标签:
PHP编程
2023-09-27
Spark大数据处理学习笔记(2.2)搭建Spark Standalone集群
...
285
标签:
spark
学习
笔记
数据库
2024-04-02
Spark作业的原理是什么
...
942
标签:
数据库
2023-04-07
Spark SQL小文件问题处理
目录1.1、小文件危害1.2、产生小文件过多的原因1.3、如何解决这种小文件的问题呢?1.3.1、调优参数1.1、小文件危害大量的小文件会影响Hadoop集群管理或者Spark在处理数据时的稳定性:1.Spark SQL写Hive或者直...
374
标签:
Spark
SQL小文件问题处理
SQL小文件问题处理
Spark处理小文件
其他教程
2023-05-14
Spark SQL小文件问题处理
大量的小文件会影响Hadoop集群管理或者Spark在处理数据时的稳定性,这篇文章主要介绍了Spark SQL小文件问题的处理,感兴趣的同学可以借鉴一下...
281
标签:
Spark SQL小文件问题处理
SQL小文件问题处理
Spark处理小文件
精选
2023-06-02
spark的基础知识点整理
这篇文章主要介绍“spark的基础知识点整理”,在日常操作中,相信很多人在spark的基础知识点整理问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”spark的基础知识点整理”的疑惑有所帮助!接下来,请跟着小编...
353
标签:
其他教程
2022-11-13
Spark GraphX 分布式图处理框架图算法详解
这篇文章主要为大家介绍了Spark GraphX 分布式图处理框架图算法详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪...
737
标签:
Spark GraphX 图算法
Spark GraphX
热门文章
Android:VolumeShaper
2022-06-06
Oracle Study--Oracle RAC CacheFusion(MindMap)
2024-04-02
Python 学习之路 - Python
2023-01-31
报表SQL
2024-04-02
[mysql]mysql8修改root密码
2020-03-03
MySQL专题3之MySQL管理
2023-01-31
返回顶部