spark – 蚂蚁学Python

spark

Spark使用Java开发遇到的那些类型错误

2023-03-122019-08-28 Leave a comment by crazyant

Spark使用Java开发其实比较方便的，JAVA8的lambda表达式使得编写体验并不比Scala差很多，但 … Read more Spark使用Java开发遇到的那些类型错误

spark

Spark使用JAVA编写自定义函数修改DataFrame

2023-03-122019-07-26 Leave a comment by crazyant

本文的代码涉及几个知识点，都是比较有用： 1、Spark用JAVA编写代码的方式； 2、Spark读取MySQ … Read more Spark使用JAVA编写自定义函数修改DataFrame

spark

PyCharm开发PySpark程序的配置和实例

2023-03-122018-12-10 by crazyant

对于PyCharm，需要作如下设置： 1、安装pyspark，它会自动安装py4j 2、在edit confi … Read more PyCharm开发PySpark程序的配置和实例

spark

Spark数据倾斜解决方法

2023-03-122018-06-25 Leave a comment by crazyant

1、避免shuffle，改reduce join为map join，适用于JOIN的时候有一个表是小表的情况， … Read more Spark数据倾斜解决方法