-
大数据处理之流式计算简介
简介Strom是一个开源的分布式流式计算系统,用来处理流式的数据,被称作为流式的hadoop,在电信行业,可以用来做大流量预警、终端营销、访问竞争对手产品从而做挽留等业务。本文将从storm在hadoop生态圈中所处位置、storm中术语、storm平台搭建、storm应用程序构建等详细介绍stor...
-
大数据处理之流式计算 storm安装
安装包准备官网下载最新稳定版本,题主下载的是apache-storm-0.9.5.tar.gz角色分配主机名IP角色
-
【大数据】2015 Bossie评选-20个最佳开源大数据技术
2015-10-10 张晓东 东方云洞察东方云洞察InfoWorld在分布式数据处理、流式数据分析、机器学习以及大规模数据分析领域精选出了2015年的开源工具获奖者,下面我们来简单介绍下这些获奖的技术工具。
-
安装Mahout
1、下载Mahoutcd /tmpwget http://mirrors.cnnic.cn/apache/mahout/0.11.0/apache-mahout-distribution-0.11.0.tar.gz2、解压tar zxvf apache-mahout-distribution-0.1...
-
Vmware后台下Citrix Xendesktop 7.6实战篇之八桌面交付2
3 创建7.6版本Remote pc access计算机目录3.1 在服务器tsddc01打开CitrixStudio,点击”计算机目录”—“创建计算机目录”--next
-
ubuntu14.04环境下hadoop2.7.0配置+在windows下远程eclipse和hdfs的调用
本教程是在三台电脑上部署的hadoop正式环境,没有建立用户组,而是在当前用户下直接进行集群的部署的,总结如下:1、三个节点的主机电脑名为:192.168.11.33 Master,192.168.11.24 Slaver2,192.168.11.4 &nb...
-
Vmware后台下Citrix Xendesktop 7.6实战篇之八桌面交付3
7 驗證5.6版本的控制器是否可以控制安装了7.6VDA的虚拟机7.1 給虛擬機安裝xendesktop 7.6的VDA並把控制器地址指向5.6的控制器10.230.10.150
-
Spark1.5.1学习笔记(二)IDE开发环境配置
鲁春利的工作笔记,谁说程序员不能有文艺范?另外有需要云服务器可以了解下风纳云fengnayun.com,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业...
-
学习Hadoop笔记(一)
从事软件开发将近四年,一直热衷于各种技术语言,但是感觉自己始终都不知道自己到底喜欢从事哪个方面的开发,毕业的前两年一直在大连做对日软件外包,做了两年后觉得真的没有什么意思,软件的设计都不是自己做的,只是需要按照需求进行程序的书写,所以和几个同事一直离职后来了北京,其实来到北...
-
hadoop 组件之spark的安装及配置
下面给出的是spark集群搭建的环境:操作系统:最小安装的CentOS 7(下载地址)Yarn对应的hadoop版本号:Hadoop的Cloudera公司发行版Hadoop2.6.0-CDH5.4.0(下载地址)Java版本号:JDK1.8(下载地址)Scala版本号:Scala2.10.4(下载地...