跳至内容

蚂蚁学Python

生命不止,探索不息,疯狂的蚂蚁

  • 首页
  • Python-答疑解惑
  • Python-基础知识
  • Python-爬虫系列
  • Python-Pandas系列
  • Python-Web开发
  • Python-大数据
  • Python-Spark
  • Python-数据分析
  • Python-机器学习
  • 推荐系统合集
  • 关于我
    • 留言小本
    • 冥想资料
    • 编程笔记
    • 常用资源
    • 个人书单
    • 个人箴言

视频公众号:蚂蚁学Python

近期文章

  • 推荐系统实现相似推荐的流程和资源
  • Pandas怎样对每个分组应用apply函数?
  • 怎样使用Pandas的map和apply函数?
  • Pandas的分层索引MultiIndex怎样用?
  • Pandas怎样实现对数据的分组统计?

分类目录

近期评论

  • crazyant发表在《推荐系统:怎样实现内容相似推荐》
  • 鱼发表在《推荐系统:怎样实现内容相似推荐》
  • crazyant发表在《听樊登的《非暴力沟通》》
  • antior发表在《听樊登的《非暴力沟通》》
  • crazyant发表在《个人书单》

标签

  • apache
  • c++
  • django
  • excel
  • flask
  • hadoop
  • hive
  • java
  • javascript
  • jquery
  • jvm
  • linux
  • mac
  • maven
  • mybatis
  • mysql
  • pandas
  • php
  • python
  • qt
  • redis
  • seo
  • shell
  • spark
  • svn
  • tensorflow
  • tomcat
  • ubuntu
  • vim
  • win7
  • word
  • wordpress
  • 大数据
  • 安全
  • 推荐系统
  • 操作系统
  • 数据分析
  • 数据库
  • 机器学习
  • 爬虫
  • 程序人生
  • 站长
  • 算法
  • 织梦
  • 设计

热门文章

  • 推荐系统实现相似推荐的流程和资源 99 views

分享文章

标签:hadoop

MapReduce文件切分个数计算方法

Hadoop的MapReduce计算的第一个阶段是InputFormat处理的,先将文件进行切分,然后将每个切 … 继续阅读MapReduce文件切分个数计算方法

发布于 2014-02-272019-07-28作者 crazyant分类 hadoop标签 hadoop于MapReduce文件切分个数计算方法留下评论

《大数据时代》是一部科幻小说

虽然一直在使用HADOOP、HIVE等技术在处理T级别的数据,认为自己也属于大数据领域的人了,然而对于什么是大 … 继续阅读《大数据时代》是一部科幻小说

发布于 2014-02-102014-02-10作者 crazyant分类 hadoop标签 hadoop《大数据时代》是一部科幻小说有3条评论

shell/hadoop/hive一些有用命令收集

有些命令工作中经常用到,记录在一个文章里用于查阅,本文经常更新。 shell命令 linux统计某个目录下所有 … 继续阅读shell/hadoop/hive一些有用命令收集

发布于 2013-09-242019-07-30作者 crazyant分类 hadoop、hive、mysql、shell标签 hadoop、hive、mysql、shell于shell/hadoop/hive一些有用命令收集留下评论

hadoop第一个程序WordCount.java的编译运行过程

java是hadoop开发的标准官方语言,本文下载了官方的WordCount.java并对其进行了编译和打包, … 继续阅读hadoop第一个程序WordCount.java的编译运行过程

发布于 2013-08-162013-08-16作者 crazyant分类 hadoop标签 hadoophadoop第一个程序WordCount.java的编译运行过程有2条评论

Hadoop-Streaming实战经验及问题解决方法总结

目录 1.   Join操作分清join的类型很重要… 2.  启动程序中key字段和partit … 继续阅读Hadoop-Streaming实战经验及问题解决方法总结

发布于 2013-04-28作者 crazyant分类 hadoop、python标签 hadoopHadoop-Streaming实战经验及问题解决方法总结有6条评论

Hadoop之使用python实现数据集合间join操作

文章分析了hadoop借助streaming功能借助python完成map reduce的功能,并对集合间join操作的需求进行阐述,然后进行了具体实例代码的编写,同时对join操作进行了归类和易采坑的总结。

发布于 2013-04-212019-07-28作者 crazyant分类 hadoop标签 hadoop、pythonHadoop之使用python实现数据集合间join操作有5条评论
自豪地采用WordPress