当前位置: 移动技术网 > IT编程>数据库>

其他数据库

【赵强老师】大数据分析引擎:Presto

2020-04-04 13:40 | 分类:数据库 | 评论:0 次 | 浏览: 61

一、什么是Presto? 背景知识:Hive的缺点和Presto的背景 Hive使用MapReduce作为底层计算框架,是专为批处理...

数据分析与挖掘

2020-04-02 13:48 | 分类:数据库 | 评论:0 次 | 浏览: 66

用于数据分析的 OLAP 系统的主要特点就是数据量非常大,并发访问不多,但每次访问所需要检索的数据量都比较多,而且数据访问相对较为集...

解决Zookeeper无法启动的问题

2020-04-02 13:48 | 分类:数据库 | 评论:0 次 | 浏览: 51

链接1:https://blog.csdn.net/u012453843/article/details/70878117 链接2:...

hadoop 多次格式化format namenode 导致节点不能启动解决

2020-04-02 13:48 | 分类:数据库 | 评论:0 次 | 浏览: 68

链接:https://blog.csdn.net/qq_41059374/article/details/80695581?dept...

干货来了!阿里发布近300页Flink实战电子书

2020-03-31 14:31 | 分类:数据库 | 评论:0 次 | 浏览: 69

近300页实用干货总结,帮你解决 Flink 实战应用难题!《Apache Flink电子书合辑》收录来自bilibili、美团点评...

Kylin 新定位:分析型数据仓库

2020-03-27 14:43 | 分类:数据库 | 评论:0 次 | 浏览: 74

2020 年 3 月,Kylin 社区决定将 Kylin 的标语从「Extreme OLAP Engine for Big Data...

nifi processer介绍

2020-03-25 14:48 | 分类:数据库 | 评论:0 次 | 浏览: 73

2.3 NiFi Processor应用介绍 对于NiFi的使用者来说,如果想要创建一个高效的数据流,那么就需要了解什么样的单元处理...

spark计算模型RDD

2020-03-23 14:22 | 分类:数据库 | 评论:0 次 | 浏览: 86

RDD介绍 1.RDD概念以及特性 RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Sp...

Elasticsearch 之聚合分析入门

2020-03-23 14:22 | 分类:数据库 | 评论:0 次 | 浏览: 105

本文主要介绍 Elasticsearch 的聚合功能,介绍什么是 Bucket 和 Metric 聚合,以及如何实现嵌套的聚合。 首...

ElasticSearch之映射常用操作

2020-03-20 14:26 | 分类:数据库 | 评论:0 次 | 浏览: 80

Mapping (映射)类似关系型数据库中的表的结构定义。我们将数据以 JSON 格式存入到 ElasticSearch 中后,在搜...

一文搞懂 Elasticsearch 之 Mapping

2020-03-18 15:52 | 分类:数据库 | 评论:0 次 | 浏览: 69

作为 Elasticsearch 的“表结构定义”的 Mapping,你可能需要了解下! ...

Flink设置并行度的方式和执行级别

2020-03-18 15:52 | 分类:数据库 | 评论:0 次 | 浏览: 113

Flink设置并行度的几种方式 代码中设置setParallelism() 全局设置: env.setParallelism(3);...

Druid 0.17 入门(3)—— 数据接入指南

2020-03-17 16:59 | 分类:数据库 | 评论:0 次 | 浏览: 154

在快速开始中,我们演示了接入本地示例数据方式,但Druid其实支持非常丰富的数据接入方式。比如批处理数据的接入和实时流数据的接入。本...

数据挖掘篇——特征工程之特征降维

2020-03-16 14:34 | 分类:数据库 | 评论:0 次 | 浏览: 82

在业界广泛流传着一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,数据和特征是多么的重要,而在数据...

看完这篇还不会 Elasticsearch 搜索,那我就哭了!

2020-03-13 14:57 | 分类:数据库 | 评论:0 次 | 浏览: 66

本文主要介绍 ElasticSearch 搜索相关的知识,首先会介绍下 URI Search 和 Request Body Sear...

「 Hadoop」mapreduce对温度数据进行自定义排序、分组、分区等 【转载】

2020-03-12 17:24 | 分类:数据库 | 评论:0 次 | 浏览: 97

原帖地址:http://www.ptbird.cn/mapreduce-tempreture.html 「 Hadoop」map...

大数据存储技术基础

2020-03-12 17:24 | 分类:数据库 | 评论:0 次 | 浏览: 96

一、绪论 1.存储的本质 信息跨越空间的传递——通讯 信息跨越时间的传递——存储 通讯:利用具有跨越空间特性的物理现象 声音、光...

sparksql 概述

2020-03-11 17:12 | 分类:数据库 | 评论:0 次 | 浏览: 87

什么是Spark SQL? Spark SQL是Spark用来处理结构化数据的一个模块,它提供了2个编程抽象:DataFrame...

ElasticSearch 文档的增删改查都不会?

2020-03-11 17:12 | 分类:数据库 | 评论:0 次 | 浏览: 75

本文主要是介绍 ElasticSearch 的文档增删改查和批量操作,同时会介绍一些 REST API 返回状态码的具体含义。 ...

通过filebeat、logstash、rsyslog采集nginx日志的几种方式

2020-03-10 15:43 | 分类:数据库 | 评论:0 次 | 浏览: 130

由于nginx功能强大,性能突出,越来越多的web应用采用nginx作为http和反向代理的web服务器。而nginx的访问日志...

Zookeeper简介

2020-03-10 15:43 | 分类:数据库 | 评论:0 次 | 浏览: 117

1.1 什么是zookeeper Zookeeper是一个分布式的、开源的分布式应用程序协调服务,是Google的Chubby一...

流处理引擎(SPE)中的的分布式一致性语义之Exactly-Once和Effectively-Onece区别

2020-03-09 17:36 | 分类:数据库 | 评论:0 次 | 浏览: 77

At most Onece:最多一次,如果算子处理事件失败,事件将不再尝试该事件。 At Least Onece:至少一次,如果...

hadoop

2020-03-09 17:36 | 分类:数据库 | 评论:0 次 | 浏览: 81

恢复内容开始 1、Hadoop是什么? Hadoop是一个Apache基金会所开发的分布式系统基础框架(Hive、Hbase、s...

从零构建Flink SQL计算平台 - 1平台搭建概述

2020-03-09 17:36 | 分类:数据库 | 评论:0 次 | 浏览: 83

一、理想与现实 Apache Flink 是一个分布式流批一体化的开源平台。Flink 的核心是一个提供数据分发、通信以及自动容...

hadoop3自学入门笔记(2)—— HDFS分布式搭建

2020-03-09 17:36 | 分类:数据库 | 评论:0 次 | 浏览: 131

一些介绍 Hadoop 2和Hadoop 3的端口区别 Hadoop 3 HDFS集群架构 我的集群规划 | name | ip...

hadoop3自学入门笔记(3)-java 操作hdfs

2020-03-09 17:36 | 分类:数据库 | 评论:0 次 | 浏览: 106

1.core site.xml 2.pom.xml 3.测试代码 testDownloadFileToLocal 这里测试请注意...

多图预警——从 RAID 到分布式系统中的副本分布

2020-03-09 17:36 | 分类:数据库 | 评论:0 次 | 浏览: 72

原文首发于个人博客「 "tobe的呓语" 」欢迎大家的访问收藏啊~ 我们知道,在面对大规模数据的计算和存储时,有两种处理思路: ...

Cassandra 在 360 的实践与改进

2020-03-09 17:36 | 分类:数据库 | 评论:0 次 | 浏览: 74

分享嘉宾:王锋 奇虎360 技术总监 文章整理:王彦 内容来源:Cassandra Meetup 出品平台:DataFunTal...

一条Sql的Spark之旅

2020-03-09 17:36 | 分类:数据库 | 评论:0 次 | 浏览: 65

背景 ​ SQL作为一门标准的、通用的、简单的DSL,在大数据分析中有着越来越重要的地位;Spark在批处理引擎领域当前也是处于...

什么是spark?

2020-03-09 17:36 | 分类:数据库 | 评论:0 次 | 浏览: 76

什么是Spark? Spark官网:http://spark.apache.org Spark是一种快速、通用、可扩展的大数据分...

移动技术网