课程:
数据分析平台的价值有哪些?
1、帮助企业了解用户
通过大数据分析技术,企业可以将客户、用户和产品进行有机串联,对用户的产品偏好,客户的关系偏好进行个性化定位,生产出用户驱动型的产品,提供客户导向性的服务。
2、帮助企业进行资源精准定位
通过大数据技术,可以实现企业对所需资源的精准定位,在企业在运营过程中,所需要的每一种资源的挖掘方式、具体情况和储量分布等,企业都可以进行搜集分析,形成基于企业的资源分布可视图,就如同“电子地图”一般,将原先只是虚拟存在的各种优势点,进行“点对点”的数据化、图像化展现,让企业的管理者可以更直观地面对自己的企业,更好地利用各种已有和潜在资源。
3、帮助企业做好运营推广
通过大数据分析可以判断客户话题各类来源的占比,确定客户上网的习惯;信息的主要话题,以及相关媒体平台曝光量,企业可以针对性得选择并制定营销活动平台、推广方向等,提升企业运营效果。
4、协助企业更好的开展服务
通过大数据计算对社交信息数据、客户互动数据等,可以帮助企业进行品牌信息的水平化设计和碎片化扩散。
如何搭建公司内部的数据平台
公司的内部数据平台,主要作用是提供给公司内部所有部门人员使用,使公司内部的所有业务能够通过数据来驱动和决策。简单点讲就是通过数据平台来驱动公司内部的数据化运营。
设计一款好用的数据产品:
1.数据产品经理本身就是一个合格的数据分析师,所以数据产品经理需要深刻的了解业务,需要知道业务部门想要看什么数据,这些数据现在是否能够获取到,业务方通过这些数据分析,是如何推进和改善业务的。
2.数据产品要根据使用方的特点设计出符合使用方需要的内容,产品要有层级和结构,如果设计的一张数据报表既要满足管理层又要满足一线业务人员的需要,那么这样的数据产品很大可能是体验比较差的,因为老板和一线人员看数据的视角不一样,老板们一般是把握业务的大方向,主要看一些关键性的指标,并希望知道这些关键指标出问题后背后的原因是什么。所以给老板设计的报表需要结构简单易懂,并能够基于这些关键指标的异常给予问题定位。一线人员主要是偏执行层面,他们看数据的粒度一般都很细。
3.数据产品一定要注意数据质量、规范、统一,因为公司的数据平台是面向所有部门的,怎么保证公司的所有部门人员对于数据的理解是一致的,这点特别难,首先公司的各个生产系统就是千差万别,由于各种客观因素,导致生产系统的数据质量和结构也会千差万别,这样数据仓库的数据建设就显得尤为重要,数据平台的数据质量依赖于数据仓库底层的数据模型,所以一个好的数据仓库很大程度上决定了数据平台的数据质量
下面就从实战的角度来加以阐述,A公司是一家电商公司,那么A公司的各个部门需要看哪些数据?他们平常看数据的场景主要是哪些呢?首先应该知道这些部门的KPI是什么,如果对负责支持的部门的KPI都不了解,怎么能设计出来好的数据报表。例如采购部门的kpi基本就是销售额用户数销售毛利采购成本,运营部门的kpi就是用户复购用户流失转化率,市场部门的kpi就是流量、新客。
那么知道各个部门的核心KPI后,主要从使用场景入手,拿采购部门来说,是怎么样看数据:
每日:
早上9:00来到公司,希望知道昨天我负责的业务这块做的怎么样了,这个时候应该设计一张基础数据报表,这张数据报表应该具有以下内容:
1. 能够查看昨天的数据,而且能够选择时间段,这样如果昨天的数据有问题,希望拉取过去一段时间的数据,看看业务趋势上是不是出了问题。
2. 指标越丰富越好,如果交易额下降了,需要看看订单数是不是下降了,如果订单数没下降了,那不是单均价出了什么问题,发现单均价降低了,那我要看看是商品结构的原因还是因为活动门槛调整导致的?
3. 数据粒度要越细越好,比如数据粒度可以从全国下钻到省份,从省份下钻到城市,这样交易额下降了我就能知道是哪个省哪个城市出了问题,这样就能针对性的解决。
早上10:00-下午18:00,业绩高峰来临,这个时候需要提一张实时监控的数据报表,通过实时监控,能够尽早的发现业务的一些异常情况,这样就能够帮助业务人员尽快的做出调整。
每周一或者月初:
部门内有周会/月会,老板可能会过工作业绩,所以我准备准备。
首先看下上周的绩效情况,这个时候需要一张关于绩效的报表数据,通过这张绩效报表:
能够知道我做的绩效完成的怎么样,排名是提升了还是下降了,了解哪些人排名高
其次对于上周出现的业务问题,通过一些分析报表定位和发现问题,比如发现用户的复购率下降了,是因为老用户的复购降低了还是最近新客的质量降低。
如果发现是老用户的复购降低了,那要进一步分析,是因为竞争对手产品活动力度大,还是因为商品的曝光不够亦或是产品本身对于用户失去了吸引力,这样就能够及时做出调整,如果是竞争对手产品活动力度大,那需要重点关注竞争对手的情况及时调整产品营销活动力度如果是商品的曝光度不够,可以从以下几个层面入手优化:
1. 优化商品的主标题和副标题,增加用户的搜索触达率。
2. 站内广告位多多增加产品的曝光或是和其他的品类商品做联合促销。
3.优化商品的导购属性信息,帮助用户跟精准的触达。如果是产品本身的问题那可能就需要引进新品(例如从国产到进口、从低端到高端)。
大数据平台有哪些架构
01
传统大数据架构
之所以叫传统大数据架构,是因为其定位是为了解决传统BI的问题。
优点:
简单,易懂,对于BI系统来说,基本思想没有发生变化,变化的仅仅是技术选型,用大数据架构替换掉BI的组件。
缺点:
对于大数据来说,没有BI下完备的Cube架构,对业务支撑的灵活度不够,所以对于存在大量报表,或者复杂的钻取的场景,需要太多的手工定制化,同时该架构依旧以批处理为主,缺乏实时的支撑。
适用场景:
数据分析需求依旧以BI场景为主,但是因为数据量、性能等问题无法满足日常使用。
02
流式架构
在传统大数据架构的基础上,直接拔掉了批处理,数据全程以流的形式处理,所以在数据接入端没有了ETL,转而替换为数据通道。
优点:
没有臃肿的ETL过程,数据的实效性非常高。
缺点:
流式架构不存在批处理,对于数据的重播和历史统计无法很好的支撑。对于离线分析仅仅支撑窗口之内的分析。
适用场景:
预警,监控,对数据有有效期要求的情况。
03
Lambda架构
大多数架构基本都是Lambda架构或者基于其变种的架构。Lambda的数据通道分为两条分支:实时流和离线。
优点:
既有实时又有离线,对于数据分析场景涵盖的非常到位。
缺点:
离线层和实时流虽然面临的场景不相同,但是其内部处理的逻辑却是相同,因此有大量荣誉和重复的模块存在。
适用场景:
同时存在实时和离线需求的情况。
04
Kappa架构
在Lambda 的基础上进行了优化,将实时和流部分进行了合并,将数据通道以消息队列进行替代。
优点:
解决了Lambda架构里面的冗余部分,以数据可重播的思想进行了设计,整个架构非常简洁。
缺点:
虽然Kappa架构看起来简洁,但实施难度相对较高,尤其是对于数据重播部分。
适用场景:
和Lambda类似,改架构是针对Lambda的优化。
05
Unifield架构
以上的种种架构都围绕海量数据处理为主,Unifield架构则将机器学习和数据处理揉为一体,在流处理层新增了机器学习层。
优点:
提供了一套数据分析和机器学习结合的架构方案,解决了机器学习如何与数据平台进行结合的问题。
缺点:
实施复杂度更高,对于机器学习架构来说,从软件包到硬件部署都和数据分析平台有着非常大的差别,因此在实施过程中的难度系数更高。
适用场景:
有着大量数据需要分析,同时对机器学习方便又有着非常大的需求或者有规划。
大数据时代各种技术日新月异,想要保持竞争力就必须得不断地学习。写这些文章的目的是希望能帮到一些人了解学习大数据相关知识 。加米谷大数据,大数据人才培养机构,喜欢的同学可关注下,每天花一点时间学习,长期积累总是会有收获的。