一、处理流程 将数据经过数据处理后,按8:1:1比例分成训练数据、校验数据和测试数据;(比例可以自己调整,方式… 继续阅读 大数据分析预测处理流程
分类: 大数据
大数据时代笔记
引言 量变导致质变; 大数据的核心就是预测:把数学算法运用到海量的数据上来预测事情发生的可能性。 大数据时间的… 继续阅读 大数据时代笔记
HBase与Hive在大数据架构中位置
Hbase和Hive在大数据架构中处在不同位置,Hbase主要解决实时数据查询问题,Hive主要解决数据处理和… 继续阅读 HBase与Hive在大数据架构中位置
Spark平台(精简版)概览
1、简介: 2、安装环境及版本: 3、目录:
Spark平台(精简版一)准备
完整目录、平台简介、安装环境及版本:参考《Spark平台(精简版)概览》 一、准备 1.1 安装Ubuntu … 继续阅读 Spark平台(精简版一)准备
Spark平台(精简版二)Hadoop单节点
完整目录、平台简介、安装环境及版本:参考《Spark平台(精简版)概览》 二、Hadoop单节点安装 2.1 … 继续阅读 Spark平台(精简版二)Hadoop单节点
Spark平台(精简版三)Hadoop多节点
完整目录、平台简介、安装环境及版本:参考《Spark平台(精简版)概览》 三、Hadoop多节点安装 3.1 … 继续阅读 Spark平台(精简版三)Hadoop多节点
Spark平台(精简版四)Hadoop之HDFS和WordCount
完整目录、平台简介、安装环境及版本:参考《Spark平台(精简版)概览》 四、操作HDFS目录 4.1&nbs… 继续阅读 Spark平台(精简版四)Hadoop之HDFS和WordCount
Spark平台(精简版五)Spark Python
完整目录、平台简介、安装环境及版本:参考《Spark平台(精简版)概览》 六、Spark Python 6.1… 继续阅读 Spark平台(精简版五)Spark Python
Spark平台(高级版)概览
简介: 安装环境及版本: 目录: