当前位置:首页 > 编程开发 > 正文内容

大数据核心技术全掌握课程视频教程

1年前 (2024-11-27)编程开发754

    本套课程讲授分布式系统构架、分布式编程、分布式流处理、分布式数据存储管理、内存计算支持等内容,覆盖大数据处理平台的主要核心技术,突出技术深度和实战性。

    课程章节

    第一讲大数据和ODPS

    主讲人:武永卫

    主讲人:程永

    QUIZ

    第二讲分布式存储

    大纲

    初步认识大数据对分布式存储系统的需求

    理解大数据对分布式存储系统的需求

    具体说明大数据对分布式存储系统的需求

    大规模分布式存储的挑战

    小概率事件-Raid卡故障

    分布式存储系统举例

    分布式存储系统重要功能设计要点剖析

    链式写正常流程

    写流程的另一种常见方式:主从模式

    链式写异常流程

    写异常处理的另一种方法-SealandNew

    读正常流程

    读流程优化-BackupRead

    IOQoS

    数据正确性:checksum

    数据可靠性-Replication

    数据均衡-Rebalance

    垃圾回收-Garbagecollection

    Erasurecoding

    Erasurecoding(3,2)写入和读取过程

    元数据管理的高可用性和可扩展性

    元数据管理的高可用性

    Paxos概要

    Raft

    元数据管理的可扩展性

    不同存储介质的特性

    盘古混合存储

    QUIZ

    第三讲资源管理与任务调度

    阿里云飞天分布式调度

    任务调度

    资源调度

    容错机制

    规模挑战

    安全域性能隔离

    分布式调度的发展方向

    QUIZ

    第四讲分布式编程模型的设计与演化

    数据格式和抽象

    分布式编程模型

    MapReuduce编程模型

    关系型数据编程模型

    分布式图计算模型

    分布式编程未来展望

    QUIZ

    实践1:通过两阶段提交协议完成数据上传

    分布式事务

    分布式一致性算法

    两阶段提交与三阶段提交

    实践--介绍

    HW1:通过两阶段提交协议完成数据上传

    第五讲离线分布式关系型计算

    关系型计算基本原理_1

    关系型计算基本原理_2

    分布式环境中的连接计算和聚合计算

    其他计算和物理优化

    QUIZ

    第六讲全局数据管理与调度

    提纲

    课程背景介绍

    前序知识

    分布式节点距离计算法则

    数据分布策略

    分布式计算调度

    数据就近原则计算如何容错

    ODPS跨集群数据依赖

    QUIZ

    实践2:编写MR完成GroupBy+Join操作

    主讲人:谢德军

    HW2:编写MR完成GroupBy+Join操作

    第七讲流式计算的系统设计与实现

    增量计算和流式计算

    与批量计算的区别

    业界典型系统技术概要分析

    核心技术

    消息机制

    有状态计算、并行DAG、抢占式调度和资源隔离、Failover机制

    StreamSQL

    QUIZ

    第八讲内存计算

    软硬件趋势、分布式计算简史与内存计算

    分布式计算

    内存计算

    统一的计算框架

    业界经典系统技术分析-spark&flink

    QUIZ

    第九讲大规模数据的分布式机器学习平台

    主讲人:褚葳

    QUIZ

    实践3:实现MapReduce编程运行时库

    分布式环境下的新问题

    工程实现范例

    课程设计相关问题

    HW3:实现MapReduce编程运行时库


资源下载
资源名称:大数据核心技术全掌握课程视频教程


扫描二维码推送至手机访问。

版权声明:本文由御杆坊发布,如需转载请注明出处。

本文链接:https://www.yuganfang.com/resource/177.html

标签: 大数据
分享给朋友:

“大数据核心技术全掌握课程视频教程” 的相关文章

7天學會大數據資料處理 NoSQL:MongoDB 入門與活用第三版

7天學會大數據資料處理 NoSQL:MongoDB 入門與活用第三版

Google的搜尋、Facebook的社交與Instagram的圓片等服務需要處理PB等級的巨量資料。網路服務業者為了解決如此龐大的資料量,使用傳統的關聯式資料庫架構必須透過資料庫叢集技術才能解決,但...

java零基础快速入门到精通VIP高端精品课程

java零基础快速入门到精通VIP高端精品课程

    Java是全球排名第一的编程语言,Java工程师也是市场需求最大的软件工程师,选择Java,硬实力高薪就业!全套总共16门课程。    第1张课程目录:...

千锋Python全栈工程师最佳学习路线课程视频教程

千锋Python全栈工程师最佳学习路线课程视频教程

    Python全栈+人工智能VIP课程,手把手带领大家从零基础学习Python语言、网络爬虫、数据分析以及人工智能应用开发。结合实际项目案例,由浅入深、全面系统地培养大家的独...

MySQL王者晋级之路PDF扫描版图书

MySQL王者晋级之路PDF扫描版图书

目前大部分软件开发平台都基于Linux,很多互联网公司都把MySQL作为后端数据存储的数据库。如果把MySQL比喻成数据库界的一条巨龙,则本书涵盖的所有知识点就是这条巨龙的组成部分。本书深入剖析MyS...

MySQL排错指南PDF扫描版电子书

MySQL排错指南PDF扫描版电子书

本书由Oracle公司的技术支持工程师编写,详细阐述了MySQL故障诊断及处理中的知识,教会读者如何深入浅出地定位错误和异常方法,分析并解决各种MySQL数据库的故障。本书共分为7章,其内容涵盖了解决...

基于Java的微信公众号二次开发视频教程

基于Java的微信公众号二次开发视频教程

鉴于使用Java进行微信开发的朋友比较多,我们结合网上视频资料为大家整理了使用Java进行二次开发的教程,共计16小节,容量7GB左右。本套课程主要讲解微信公众平台开发的基础知识,课程针对有一定Jav...