hive – 蚂蚁学Python

hive

Hive实现返回MAP的UDF

如果只是返回String，那么直接继承UDF即可，如果想要返回MAP/LIST/STRUCT，则需要继承Gen … Read more Hive实现返回MAP的UDF

hive

本文对Hive开发中遇到的问题进行了问答式总结，通过代码实例讲解了hive传参、优化方法、使用HIVE技巧、Streaming扩展等特性。

hive

遇到这么一个需求，输入数据为一个ID对应多个name，要求输出数据为ID是唯一的，name随便取一个就可以。 … Read more Hive取非Group by字段数据的方法

hive

Hive的Join的文档说明地址： https://cwiki.apache.org/confluence/d … Read more Hive的left join、left outer join和left semi join三者的区别

hive

Hive基于HADOOP来执行分布式程序的，和普通单机程序不同的一个特点就是最终的数据会产生多个子文件，每个r … Read more Hive中Order by和Sort by的区别是什么?

hive

图 1 外部向Hive程序中传递变量的方法使用Hive编写程序最常用的方法是将Hive语句写到文件中，然后使 … Read more 向Hive程序传递变量的三种方法

hive

今天遇到一个HIVE需求，输入只有4列，大概160MB，需要引用一些字典文件，然后输出70列数据；典型的复杂 … Read more 把HIVE程序优化30倍的经验

hive

1、Python环境设置可以使用add cachearchive的方法把tar.gz添加到分布式缓存，Hiv … Read more Hive使用TRANSFORM运行Python脚本总结