Flink-源码学习-集群启动系列
一、概述Flink 集群在不同部署模式下的启动流程也有所差距~
二、部署2.1. Standalone
引用本站文章
Flink-源码学习-集群启动-standalone
Joker
2.2. Yarnsession |per_job |application
引用本站文章
Flink-源码学习-集群启动-yarn-session
Joker
引用本站文章
Flink-源码学习-集群启动-yarn ...
Hadoop-发展-大厂分享
Hadoop-发展-大厂分享系列主要有 4 篇,按顺序看哦😯~~~
eBay 大数据平台的 HDFS 性能优化实践
引用站外地址,不保证站点的可用性和安全性
eBay 大数据平台的 HDFS 性能优化实践
Joker
Hadoop-组件-HDFS 系列
一、概述Hadoop 是一个能够让用户轻松架构和使用的分布式计算平台,用户可以在 Hadoop 上管理、开发和运行处理大规模数据的应用,其中,Hadoop 分布式文件系统(Hadoop Distributed File System, HDFS) 以文件系统的形式为应用提供海量数据存储服务。
二、学习笔记
引用本站文章
Hadoop-组件-HDFS-学习笔记
Joker
三、源码学习
引用本站文章
Hadoop-组件-HDFS-源码系列
Joker
四、大厂分享
引用本站文章
...
Hadoop-组件-HDFS-发展-大厂分享系列
Hadoop-组件-HDFS-发展-大厂分享系列😯~~~
HDFS 在字节跳动的优化实践
字节跳动应用 HDFS 已经非常长的时间了,经历了 7 年的发展,目前已直接支持了十多种数据平台,间接支持了上百种业务发展。从集群规模和数据量来说,HDFS 平台在公司内部已经成长为总数几万台服务器的大平台,支持了 EB 级别的数据量…
小米技术-HDFS-Tiering 数据分层存储
经过我们对 HDFS 元数据信息的分析,以印度离线集群为例,发现半年以上没有访问的冷数据大约占 25% 左右。这些数据存储在高性能高成本的 EBS 上是一种浪费,是否可能把这部分冷数据存储到更便宜的存储介质上?答案是肯定的…
快手EB级HDFS挑战与实践
作为快手内部数据规模和机器规模最大的分布式文件存储系统,HDFS一直伴随着快手业务的飞速发展而快速成长…
网易大数据平台 HDFS 性能优化实践
整个 NameNode 在启动中的主要步骤几个地方比较耗时,一是在加载元数据的时候,也就是加载FSImage,二是NameNode在处理DataNode上报数据时,如果管理的数据非常多是比较慢的…
eBay HD ...
Hadoop-组件-HDFS-源码学习-阅读环境搭建
一、编译在GitHub 下载源码并编译:
12git clone git@github.com:apache/flink.gitgit checkout release-1.6.3
1.1. 编译环境Hadoop 源码编译所需的其他软件在源码包的 BUILDING.txt 文件中有介绍:
123456789maven: Apache Maven 3.6.0jdk: jdk_1.8.0_201ProtocolBuffer: portoc-2.5.0zlib: 1.2.3-libOpenSSL: 1_0_2rcmale: 3.14.3-win64-x64Cygwin: 2.897_x86_64hadoop: hadoop-2.9.2snappy:
1.2. 可能遇到的问题1.2.1. protoc2.51.2.2. DynamoDBLocal.jar
下载
引用站外地址,不保证站点的可用性和安全性
Amazon DynamoDB
Amazon
...
Hadoop-组件-HDFS-源码学习系列
一、阅读环境搭建
引用本站文章
Hadoop-组件-HDFS-源码学习-源码阅读环境搭建
Joker
二、架构设计HDFS 集群遵循主从架构。每个群集包括一个主节点和多个从节点。在内部,文件分为一个或多个块,每个块根据复制因子存储在不同的从节点计算机上。主节点存储和管理文件系统名称空间,即有关文件块的信息,例如块位置,权限等。从节点存储文件的数据块。主从各司其职,互相配合,共同对外提供分布式文件存储服务。当然内部细节对于用户来说是透明的。
引用本站文章
Hadoop-组件-HDFS-理论笔记-HDFS 架构设计
Joker
...
Hadoop-组件-HDFS-理论笔记系列
一、架构设计Hadoop-组件-HDFS-理论笔记-架构系列主要有 1 篇😯~~~
HDFS 架构设计
HDFS 集群遵循主从架构。每个群集包括一个主节点和多个从节点。在内部,文件分为一个或多个块,每个块根据复制因子存储在不同的从节点计算机上。主节点存储和管理文件系统名称空间,即有关文件块的信息,例如块位置,权限等。从节点存储文件的数据块。主从各司其职,互相配合,共同对外提供分布式文件存储服务。当然内部细节对于用户来说是透明的。
Hadoop-组件-MapReduce 系列
一、概述MapReduce 是一个分布式运算程序的编程框架,核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在 Hadoop 集群上。
二、学习笔记
引用本站文章
Hadoop-组件-MapReduce-学习笔记
Joker
三、源码学习还未施工😯~~~
四、发展4.1. 社区还未施工😯~~~
4.2. 大厂分享还未施工😯~~~
4.3. 二次开发还未施工😯~~~
五、参考5.1. 书籍5.2. 课程
Hadoop-组件-MapReduce-理论笔记系列
一、概述Hadoop-组件-MapReduce-理论笔记系列-MapReduce 概述主要有 1 篇哦😯~~~
MapReduce 概述
MapReduce 1.x 的架构是主从架构。一个 JobTracker[主节点] 带多个 TaskTracker[从节点],从节点通过向主节点发送心跳信息来告诉它自己的运行情况,而主节点则是负责管理调度的工作。
二、shuffle
Hadoop-组件-Yarn 系列
一、概述 Yarn 是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台
二、学习笔记
引用本站文章
Hadoop-组件-Yarn-学习笔记
Joker
三、源码学习还未施工😯~~~
四、大厂分享
引用本站文章
Hadoop-组件-Yarn-发展-大厂分享系列
Joker
五、参考5.1. 书籍5.2. 课程