经典:一个大数据项目的架构设计与实施方案

从菜鸟到架构师,不仅需要的是时间的磨练,更需要的是机会和平台。对于大数据技术的应用,不管是传统行业还是互联网行业,已经开始大范围的应用。很多人也轰轰烈烈的加入到大数据技术学习的行列中来,但大多数是三分钟热情高涨但又无法坚持到底。原因不是不想学,而是太复杂,坑太多。

对于接触过大数据技术的人应该比较清楚,大数据技术框架都是开源的,一个项目的完成需要众多技术的整合,包括安装、部署、开发、集成等。开源的也就免费,免费的东西有好的一方面,也有不好的一方面,好的一面就是企业应用不用花钱,尽管用。不好的一面也是学习者都感同身受,比较苦恼,就是坑太多,不是这个版本有bug,就是那个版本不兼容。在企业应用中对框架补漏修改是常有的事。也正因为这个,成就了行业很多的技术高手。当然,这也是为啥大数据人才稀缺并且薪水高的原因。

所以本篇我们为大家分享一套完整的大数据项目架构设计与实施方案,也是希望有基础的学习者能通过这个课程,一点画面,系统的学习,并且能彻彻底底的感受学习大数据技术所带来的成就感。体验自己如何根据零碎的基础知识能快速的架构设计大数据项目,并且完整的得以实施。

先来谈谈我们的需求,我们要对某新闻网做用户行为分析,需要达到以下几个要求:

实时捕获用户浏览日志信息并且存储(TB级别)

实时分析前20名流量最高的新闻话题

实时统计当前线上已曝光的新闻话题量

离线分析统计哪个时段用户浏览量最高

报表

对外发布数据

针对以上的需求,如果是你该如何架构设计满足用户需求的系统呢?

先来看看卡弗卡大数据对以上需求实现的需求结果:

以上图描述的很清晰,基本完成了我们三个需求。接下来就是我们要分享的核心:系统架构设计。这个是非常重要的,他是在你完全熟练掌握技术基础之上,根据业务需求的理解而进行的设计工作。我们来看第一张图:

系统架构设计

架构设计中的所有技术框架在我们的系统实施过程中都得到了应用,当然,如何没用,我们也不会放在架构图中。哈哈。如果你能看懂这张图,那得恭喜你,你快入行了,如果看不懂,那说明你还只是个菜鸟,继续努力吧。

系统数据流程设计

在需求中我们提的很明确,有三个要点:第一是数据实时获取并存储;第二是数据实时在线分析;第三数据批量离线分析。所以在流程图上会有两个不同颜色的流程分支,一个是代表实时数据处理,一个是代表离线批量数据处理。如果你想学点什么,你应该会仔细的看这张图,因为图上的每一个标识,不管图标大小所描述的都是核心,都是重点。切记!

集群服务节点规划

大数据项目,玩的都是集群。没有一个企业会在单节点机器上玩大数据应用。除非你自己学习之用。上图是我们对此系统的服务节点规划,一个机器上放什么节点服务,这都是有原因的。不是你想放什么节点就放什么节点。所以架构设计中的机器规划部署也是非常重要的,在业务需求的基础上要做好资源的合理规划,包括扩展性和稳定性。

说了这么多,该如何实施呢?

一个完整项目的全流程实施,从架构设计、技术选型、环境配置、安装部署、研发、整合集成、数据可视化交互等各个方面所要求的知识点很多,如果是新手或者初学者,不是几篇文章能说的清楚的,也不是一朝一夕你能的搞明白的。当然这不是个人能力的问题,而是大数据技术框架本身的坑很多,如果没有系统完整案例的指导,你可能得自己一个一个的去填坑才有可能到达你想要的结果。我说的一点也不严重,不信你可以去试试,呵呵。

如果你想尽快的掌握一个完整的大数据项目架构与实施,请参加我们的线上直播课,没有别的,只是让我们的经验有价值的得到分享。

从菜鸟到架构师,不仅需要的是时间的磨练,更需要的是机会和平台。对于大数据技术的应用,不管是传统行业还是互联网行业,已经开始大范围的应用。很多人也轰轰烈烈的加入到大数据技术学习的行列中来,但大多数是三分钟热情高涨但又无法坚持到底。原因不是不想学,而是太复杂,坑太多。

对于接触过大数据技术的人应该比较清楚,大数据技术框架都是开源的,一个项目的完成需要众多技术的整合,包括安装、部署、开发、集成等。开源的也就免费,免费的东西有好的一方面,也有不好的一方面,好的一面就是企业应用不用花钱,尽管用。不好的一面也是学习者都感同身受,比较苦恼,就是坑太多,不是这个版本有bug,就是那个版本不兼容。在企业应用中对框架补漏修改是常有的事。也正因为这个,成就了行业很多的技术高手。当然,这也是为啥大数据人才稀缺并且薪水高的原因。

所以本篇我们为大家分享一套完整的大数据项目架构设计与实施方案,也是希望有基础的学习者能通过这个课程,一点画面,系统的学习,并且能彻彻底底的感受学习大数据技术所带来的成就感。体验自己如何根据零碎的基础知识能快速的架构设计大数据项目,并且完整的得以实施。

先来谈谈我们的需求,我们要对某新闻网做用户行为分析,需要达到以下几个要求:

实时捕获用户浏览日志信息并且存储(TB级别)

实时分析前20名流量最高的新闻话题

实时统计当前线上已曝光的新闻话题量

离线分析统计哪个时段用户浏览量最高

报表

对外发布数据

针对以上的需求,如果是你该如何架构设计满足用户需求的系统呢?

先来看看卡弗卡大数据对以上需求实现的需求结果:

以上图描述的很清晰,基本完成了我们三个需求。接下来就是我们要分享的核心:系统架构设计。这个是非常重要的,他是在你完全熟练掌握技术基础之上,根据业务需求的理解而进行的设计工作。我们来看第一张图:

系统架构设计

架构设计中的所有技术框架在我们的系统实施过程中都得到了应用,当然,如何没用,我们也不会放在架构图中。哈哈。如果你能看懂这张图,那得恭喜你,你快入行了,如果看不懂,那说明你还只是个菜鸟,继续努力吧。

系统数据流程设计

在需求中我们提的很明确,有三个要点:第一是数据实时获取并存储;第二是数据实时在线分析;第三数据批量离线分析。所以在流程图上会有两个不同颜色的流程分支,一个是代表实时数据处理,一个是代表离线批量数据处理。如果你想学点什么,你应该会仔细的看这张图,因为图上的每一个标识,不管图标大小所描述的都是核心,都是重点。切记!

集群服务节点规划

大数据项目,玩的都是集群。没有一个企业会在单节点机器上玩大数据应用。除非你自己学习之用。上图是我们对此系统的服务节点规划,一个机器上放什么节点服务,这都是有原因的。不是你想放什么节点就放什么节点。所以架构设计中的机器规划部署也是非常重要的,在业务需求的基础上要做好资源的合理规划,包括扩展性和稳定性。

说了这么多,该如何实施呢?

一个完整项目的全流程实施,从架构设计、技术选型、环境配置、安装部署、研发、整合集成、数据可视化交互等各个方面所要求的知识点很多,如果是新手或者初学者,不是几篇文章能说的清楚的,也不是一朝一夕你能的搞明白的。当然这不是个人能力的问题,而是大数据技术框架本身的坑很多,如果没有系统完整案例的指导,你可能得自己一个一个的去填坑才有可能到达你想要的结果。我说的一点也不严重,不信你可以去试试,呵呵。

如果你想尽快的掌握一个完整的大数据项目架构与实施,请参加我们的线上直播课,没有别的,只是让我们的经验有价值的得到分享。


相关文章

  • 软件架构设计的目的
  • 软件架构设计的目的 对于外包业务类型的项目,软件架构设计的目的与产品类型的项目有所不同,在这里主要讨论外包类型项目的软件架构设计目的. 1.为大规模开发提供基础和规范,并提供可重用的资产,软件系统的大规模开发,必须要有一定的基础和遵循一定的 ...查看


  • Linux经典书籍
  • 传人说:这几本书确实非常经典,自己也拿下了其中的三本,个人感觉是: <高级编程>虽然自己看过一遍,但由于是在培训的过程中,没有 有效深入,理解的还是不够深...等再看内核或者驱动的时候再回过头来翻翻看看吧 <人月神话> ...查看


  • 系统分析与设计课后习题答案
  • 第一章 1. 什么是系统?信息系统一般具有那些特性? 答:系统是一组为实现某些结果相互联系相互作用的部件的集合. 1.可分解性2. 边界性 2. 从应用范围来看,信息系统可以分为哪些类型? 答:1. 事物处理系统2. 管理信息系统3. 智能 ...查看


  • 如何选择最合适的服务器方案(一):服务器硬件配置
  • 我们抛开 租用服务器还是自行购买服务器进行托管的问题,在这篇文章里,我们讨论的是无论租用或托管都要面临的一个问题,那就是选择服务器的硬件配置.因为上帝不会给你一台服务器来满足所有需求,解决所有的问题.尤其是我们身处在这样一个飞速变化的时代, ...查看


  • 软件系统概要设计及总体架构设计
  • 目 录 1.1 软件系统概要设计及总体架构设计 ............................................................................. 2 1.1.1 系统设计概述 ... ...查看


  • 华为架构设计说明书
  • 架构设计说明书 产品发布标识 [填写说明:模板中用方括号括起来并以蓝色斜体显示的文本,用于向作者提供指导,在 文档编辑完成后应该将其删除.文档正文应使用常规.黑色.五号字体即系统设置的"正文"样式 文档页眉处的" ...查看


  • 教学资源库软件项目立项报告
  • 教学资源库软件开发 立 项 报 告 项目负责人:陈远彬 部 门:研发部 日 期:2011.10.16 目录 1.项目立项背景及目的 ...................................................... ...查看


  • 实验总体要求
  • 实验总体要求 学生采用"项目小组"的形式,结合具体的开发项目进行设计. 具体要求如下: 1.班级按项目小组进行分组,每组4至5人: 2.每个项目小组成员要分配不同的工作角色: 3.选出项目负责人,负责召集项目组成员讨论. ...查看


  • 中国农业银行企业架构梳理与优化
  • IT建设已经成为企业实现其战略目标,提升竞争力的必不可少的举措之一.随着市场竞争的加剧.业务规模的发展和业务领域的扩大,企业应该有怎样的IT架构.组织及能力,才能更好地支撑其业务的发展和战略目标的实现呢? 企业架构梳理与优化――IT建设必经 ...查看


热门内容