Skip to content

蚂蚁学Python

博学之、审问之、慎思之、明辨之、笃行之

  • 视频课程
  • 关于我
Categories hive

Hive中Order by和Sort by的区别是什么?

2023-03-122014-06-19 Leave a comment by crazyant

Hive基于HADOOP来执行分布式程序的,和普通单机程序不同的一个特点就是最终的数据会产生多个子文件,每个r … Read more Hive中Order by和Sort by的区别是什么?


Categories hive

向Hive程序传递变量的三种方法

2023-03-122014-06-19 Leave a comment by crazyant

图 1 外部向Hive程序中传递变量的方法 使用Hive编写程序最常用的方法是将Hive语句写到文件中,然后使 … Read more 向Hive程序传递变量的三种方法


Categories hive

把HIVE程序优化30倍的经验

2023-03-122014-05-28 Leave a comment by crazyant

今天遇到一个HIVE需求,输入只有4列,大概160MB,需要引用一些字典文件,然后输出70列数据; 典型的复杂 … Read more 把HIVE程序优化30倍的经验


Categories hive

Hive使用TRANSFORM运行Python脚本总结

2023-03-122014-05-07 1 Comment by crazyant

1、Python环境设置 可以使用add cachearchive的方法把tar.gz添加到分布式缓存,Hiv … Read more Hive使用TRANSFORM运行Python脚本总结


Categories mysql

MySQL 查看数据库中每个表占用的空间大小

2023-03-122014-03-04 6 Comments by crazyant

转自:http://www.oschina.net/question/12_3673 1、进去指定schema … Read more MySQL 查看数据库中每个表占用的空间大小


Categories java

Java使用lombok自动生成getter和setter方法

2023-03-122014-02-28 1 Comment by crazyant

lombok 可帮你在编译时自动生成getter、setter等方法,所以我们无需再编写占据很大篇幅的gett … Read more Java使用lombok自动生成getter和setter方法


Categories hadoop

MapReduce文件切分个数计算方法

2023-03-122014-02-27 Leave a comment by crazyant

Hadoop的MapReduce计算的第一个阶段是InputFormat处理的,先将文件进行切分,然后将每个切 … Read more MapReduce文件切分个数计算方法


Categories 读书心得

《大数据时代》是一部科幻小说

2023-03-122014-02-10 3 Comments by crazyant

虽然一直在使用HADOOP、HIVE等技术在处理T级别的数据,认为自己也属于大数据领域的人了,然而对于什么是大 … Read more 《大数据时代》是一部科幻小说


Post navigation
Older posts
Newer posts
← Previous 1 … 34 35 36 … 50 Next →

文章分类

  • C++ (8)
  • chatgpt (3)
  • django (16)
  • docker (4)
  • fastapi (3)
  • flask (11)
  • hadoop (5)
  • hive (14)
  • java (20)
  • javascript (1)
  • kafka (1)
  • linux (18)
  • mac (4)
  • mysql (26)
  • numpy (2)
  • paddlepaddle (1)
  • pandas (42)
  • php (39)
  • pyecharts (1)
  • pyqt (6)
  • python (34)
  • python环境 (30)
  • python趣味小程序 (3)
  • redis (4)
  • sklearn (1)
  • spark (6)
  • tensorflow (3)
  • zookeeper (1)
  • 产品想法 (1)
  • 办公自动化 (10)
  • 大数据 (1)
  • 大模型 (3)
  • 推荐系统 (7)
  • 数据科学 (1)
  • 数据结构与算法 (1)
  • 机器学习 (4)
  • 爬虫 (24)
  • 电商 (2)
  • 程序人生 (26)
  • 程序员自媒体 (12)
  • 腾讯课堂 (1)
  • 自动化测试 (1)
  • 读书心得 (8)
  • 软件工具 (9)
  • 量化投资 (6)
© 2025 蚂蚁学Python • Theme Xena