当前位置:首页 > 编程开发 > 正文内容

大数据核心技术全掌握课程视频教程

7个月前 (11-27)编程开发478

    本套课程讲授分布式系统构架、分布式编程、分布式流处理、分布式数据存储管理、内存计算支持等内容,覆盖大数据处理平台的主要核心技术,突出技术深度和实战性。

    课程章节

    第一讲大数据和ODPS

    主讲人:武永卫

    主讲人:程永

    QUIZ

    第二讲分布式存储

    大纲

    初步认识大数据对分布式存储系统的需求

    理解大数据对分布式存储系统的需求

    具体说明大数据对分布式存储系统的需求

    大规模分布式存储的挑战

    小概率事件-Raid卡故障

    分布式存储系统举例

    分布式存储系统重要功能设计要点剖析

    链式写正常流程

    写流程的另一种常见方式:主从模式

    链式写异常流程

    写异常处理的另一种方法-SealandNew

    读正常流程

    读流程优化-BackupRead

    IOQoS

    数据正确性:checksum

    数据可靠性-Replication

    数据均衡-Rebalance

    垃圾回收-Garbagecollection

    Erasurecoding

    Erasurecoding(3,2)写入和读取过程

    元数据管理的高可用性和可扩展性

    元数据管理的高可用性

    Paxos概要

    Raft

    元数据管理的可扩展性

    不同存储介质的特性

    盘古混合存储

    QUIZ

    第三讲资源管理与任务调度

    阿里云飞天分布式调度

    任务调度

    资源调度

    容错机制

    规模挑战

    安全域性能隔离

    分布式调度的发展方向

    QUIZ

    第四讲分布式编程模型的设计与演化

    数据格式和抽象

    分布式编程模型

    MapReuduce编程模型

    关系型数据编程模型

    分布式图计算模型

    分布式编程未来展望

    QUIZ

    实践1:通过两阶段提交协议完成数据上传

    分布式事务

    分布式一致性算法

    两阶段提交与三阶段提交

    实践--介绍

    HW1:通过两阶段提交协议完成数据上传

    第五讲离线分布式关系型计算

    关系型计算基本原理_1

    关系型计算基本原理_2

    分布式环境中的连接计算和聚合计算

    其他计算和物理优化

    QUIZ

    第六讲全局数据管理与调度

    提纲

    课程背景介绍

    前序知识

    分布式节点距离计算法则

    数据分布策略

    分布式计算调度

    数据就近原则计算如何容错

    ODPS跨集群数据依赖

    QUIZ

    实践2:编写MR完成GroupBy+Join操作

    主讲人:谢德军

    HW2:编写MR完成GroupBy+Join操作

    第七讲流式计算的系统设计与实现

    增量计算和流式计算

    与批量计算的区别

    业界典型系统技术概要分析

    核心技术

    消息机制

    有状态计算、并行DAG、抢占式调度和资源隔离、Failover机制

    StreamSQL

    QUIZ

    第八讲内存计算

    软硬件趋势、分布式计算简史与内存计算

    分布式计算

    内存计算

    统一的计算框架

    业界经典系统技术分析-spark&flink

    QUIZ

    第九讲大规模数据的分布式机器学习平台

    主讲人:褚葳

    QUIZ

    实践3:实现MapReduce编程运行时库

    分布式环境下的新问题

    工程实现范例

    课程设计相关问题

    HW3:实现MapReduce编程运行时库


资源下载
资源名称:大数据核心技术全掌握课程视频教程


扫描二维码推送至手机访问。

版权声明:本文由御杆坊发布,如需转载请注明出处。

本文链接:https://www.yuganfang.com/resource/177.html

标签: 大数据
分享给朋友:

“大数据核心技术全掌握课程视频教程” 的相关文章

Vue.js项目实战PDF电子书

Vue.js项目实战PDF电子书

第1章,Vue开发入门 。这一章介绍如何利用动态模板创建一个基本的Vue应用,以及如何通过指令实现基本的交互。第2章,项目1:Markdown笔记本 。这一章探索创建一个完整的Vue应用要使用的功能,...

张耀春Vue.js权威指南PDF电子书

张耀春Vue.js权威指南PDF电子书

Vue.js 是一个用来开发 Web 界面的前端库。本书致力于普及国内 Vue.js 技术体系,让更多喜欢前端的人员了解和学习 Vue.js。如果你对 Vue.js 基础知识感兴趣,如果你对源码解析感...

Excel.VBA实战技巧精粹PDF扫描版

Excel.VBA实战技巧精粹PDF扫描版

本书内容侧重于Excel VBA使用技巧,旨在帮助Excel VBA的初学者和有一定ExcelVBA应用基础、希望进阶的读者。全书精选了279个技巧、近300个典型实例,并辅以深入浅出的剖析,力求让更...

SQL Server2016从入门到实战PDF扫描版图书

SQL Server2016从入门到实战PDF扫描版图书

SQLSaver 数据车是 Micros0tt 公司推出的数据库管理系统,2016 版本在性能和人机交互等方面均有显著提高.本书是一本帮助用户踏入数据库之门的教程。全书内容分为4部分。第1部分(第1~...

博雅Scratch入门编程视频全20讲视频课程

博雅Scratch入门编程视频全20讲视频课程

cratch编程入门,专为少儿设计的编程课,从入门到进阶体系完整,助力少儿提升思维能力Scratch 是由美国麻省理工学院媒体实验室终身幼稚园小组研发的一种图形化的编程语言[Download]资源名称...

7天學會大數據資料處理 NoSQL:MongoDB 入門與活用第三版

7天學會大數據資料處理 NoSQL:MongoDB 入門與活用第三版

Google的搜尋、Facebook的社交與Instagram的圓片等服務需要處理PB等級的巨量資料。網路服務業者為了解決如此龐大的資料量,使用傳統的關聯式資料庫架構必須透過資料庫叢集技術才能解決,但...