基于Hadoop集群的用户运动推荐系统

龙源期刊网 http://www.qikan.com.cn

基于Hadoop 集群的用户运动推荐系统 作者:陈诚 谢胜利

来源:《电脑知识与技术》2016年第05期

摘要:随着生活水平的提高,人们的健康意识越来越强。但是目前人们体育运动持续性还是比较差,为了改变这一现状,我们研究设计了基于Hadoop 集群的用户运动推荐系统。系统通过统计分析用户运动信息,获取大众用户的运动习惯,设计人们感兴趣的运动模式,以提高人们的运动积极性。系统包括了三大系统组件,用户运动数据采集组件、运动数据分析组件和运动数据管理组件。

关键词:运动;互联网;大数据;数据分析;Hadoop

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)05-0169-02 1 研究背景

目前,中国健身产业逐渐形成,我国健身市场呈现出多样化的特点。国务院2011年2月24日发布关于全民健身计划的通知,对国民健身发展提出了目标任务,更是刺激了健身行业的发展。目前我国18到50岁之间对相关服务有需求的消费者人数已超过4亿,已成为世界上最大的商业健身休闲市场[1]。然而,健身行业主要还是以传统健身房为主,健身房会员和私教课程的价格比较高。而相对于传统健身房,我们可以根据本系统分析不同地域用户的运动习惯,配置对应的运动设备,控制用户与健身房的距离,最大化降低运营成本,迎合普通人群的消费能力,实现全民健身。

另一方面,随着移动互联网的高速发展及移动智能终端的普及,互联网所产生的数据量呈现指数增长,使得包括健身行业在内的移动电子商务具有巨大的发展潜力[2]。目前每日用户运动产生TB 级甚至PB 级的运动数据,采集到用户的运动数据后,如何这些海量数据中挖取出有用的信息,越来越具有重大的实际意义[3]。本文针对用户运动产生的海量数据,搭建一个基于Hadoop 及其相关组件的分布式系统,用于从中提取出我们所需要的信息,进行用户行为习惯分析。

2 系统架构设计

本系统通过Hadoop 集群实现海量运动数据的存储和分析,构建用户运动数据端到端的大数据挖掘系统,实现用户的运动行为分析,提供运动推荐服务,实现从海量运动数据采集、分析、推荐运动服务的完整流程,包括了从用户运动数据采集、运动数据分析和运动数据管理三大组件,如下图所示:

系统各个运动组件分别采用了当前主流的系统框架。我们通过手机移动端APP 和特殊健身器械获取数据,在接口层采用SpringMVC+Hibernate主流框架,将基本数据存入MySQL ,

龙源期刊网 http://www.qikan.com.cn

基于Hadoop 集群的用户运动推荐系统 作者:陈诚 谢胜利

来源:《电脑知识与技术》2016年第05期

摘要:随着生活水平的提高,人们的健康意识越来越强。但是目前人们体育运动持续性还是比较差,为了改变这一现状,我们研究设计了基于Hadoop 集群的用户运动推荐系统。系统通过统计分析用户运动信息,获取大众用户的运动习惯,设计人们感兴趣的运动模式,以提高人们的运动积极性。系统包括了三大系统组件,用户运动数据采集组件、运动数据分析组件和运动数据管理组件。

关键词:运动;互联网;大数据;数据分析;Hadoop

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)05-0169-02 1 研究背景

目前,中国健身产业逐渐形成,我国健身市场呈现出多样化的特点。国务院2011年2月24日发布关于全民健身计划的通知,对国民健身发展提出了目标任务,更是刺激了健身行业的发展。目前我国18到50岁之间对相关服务有需求的消费者人数已超过4亿,已成为世界上最大的商业健身休闲市场[1]。然而,健身行业主要还是以传统健身房为主,健身房会员和私教课程的价格比较高。而相对于传统健身房,我们可以根据本系统分析不同地域用户的运动习惯,配置对应的运动设备,控制用户与健身房的距离,最大化降低运营成本,迎合普通人群的消费能力,实现全民健身。

另一方面,随着移动互联网的高速发展及移动智能终端的普及,互联网所产生的数据量呈现指数增长,使得包括健身行业在内的移动电子商务具有巨大的发展潜力[2]。目前每日用户运动产生TB 级甚至PB 级的运动数据,采集到用户的运动数据后,如何这些海量数据中挖取出有用的信息,越来越具有重大的实际意义[3]。本文针对用户运动产生的海量数据,搭建一个基于Hadoop 及其相关组件的分布式系统,用于从中提取出我们所需要的信息,进行用户行为习惯分析。

2 系统架构设计

本系统通过Hadoop 集群实现海量运动数据的存储和分析,构建用户运动数据端到端的大数据挖掘系统,实现用户的运动行为分析,提供运动推荐服务,实现从海量运动数据采集、分析、推荐运动服务的完整流程,包括了从用户运动数据采集、运动数据分析和运动数据管理三大组件,如下图所示:

系统各个运动组件分别采用了当前主流的系统框架。我们通过手机移动端APP 和特殊健身器械获取数据,在接口层采用SpringMVC+Hibernate主流框架,将基本数据存入MySQL ,


相关文章

  • 大数据基本概念-原创
  • 大数据究竟是什么?一篇文章让你认识并读懂大数据 在写这篇文章之前,我发现身边很多IT 人对于这些热门的新技术.新趋势往往趋之若鹜却又很难说的透彻,如果你问他大数据和你有什么关系?估计很少能说出一二三来.究其原因,一是因为大家对新技术有着相同 ...查看


  • 面向服务的大数据分析平台解决方案_黄哲学
  • 中 国 高 技术 产业发展促 进 会 hi na H c So igh -Tec on h Industry Promoti 面向服务的大数据分析平台解决方案 * ■ 黄哲学 ** 陈小军 ** 李俊杰 ** 王 强 ** 中国科学院深圳先 ...查看


  • 虚拟化与云计算实验报告
  • 虚拟化与云计算 实 验 报 告 目录 一.实验目的 . ............................................................................................ ...查看


  • 视频监控大数据的关键技术和应用
  • 视频监控的大数据趋势 视频监控从最早的模拟闭路监控系统开始,经历过模拟监控.数字监控.网络监控等重要发展阶段,如今进入了大数据的时代,并面临着一系列的挑战. 视频监控产生的数据正迅速增长 视频监控数据的增长有三个主要的因素.首先,视频监控不 ...查看


  • 大数据技术原理及应用
  • 大数据技术原理及应用 大数据处理架构-Hadoop 简介 Hadoop 项目包括了很多子项目,结构如下图 原名:Core ,包含HDFS, MapReduce 和其他公共项目,从Hadoop 0.21版本后,HDFS 和MapReduce ...查看


  • 大数据分类探究
  • 大数据分类探究 云安全联盟大数据工作组发布 译者:李毅 中国惠普大学资深培训专家 摘要 在本文中,我们提出了一个大数据的六维度分类方法.这个分类方法的主要目的是帮助决策制定者在计算和存储架构以及数据分析技术.安全与隐私框架等多种选择中寻找正 ...查看


  • 基于HADOOP的大数据描述统计分析
  • 作者:宋廷山郭思亮韩伟 统计与信息论坛 2016年01期 一.研究背景 据IBM估算,全世界每天大约产生250兆字节的数据,而且世界上大约90%的数据是在近两年的时间里产生的[1].这些数据的来源也相当广泛:如各种互联网企业,像SNS.微博 ...查看


  • 基于云计算的数据挖掘的信息检索
  • 2012-2013学年度第 二 学期 信息检索与利用专题检索报告 课题: 基于云计算的数据挖掘 学号 手机 2013年 6月23日 一.课题分析 云计算(cloud computing)是基于的相关服务的增加.使用和交付模式,通常涉及通过互 ...查看


  • 云计算应用实例(三家对比)
  • 云计算应用实例 IBM 公司于2007年底宣布了云计算计划,云计算的概念出现在大众面前.本文简要介绍云计算概念的理解及主要应用实例. 一.深入理解云计算 在IBM 的技术白皮书 "Cloud Computing"中对云计 ...查看


热门内容