博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据的六大规则
阅读量:4040 次
发布时间:2019-05-24

本文共 1113 字,大约阅读时间需要 3 分钟。

大数据的六大规则

大数据包括结构化数据(Structured Data)和非结构化数据(Unstructured Data)。


1. 在早期阶段,先建立数据灯塔再考虑大数据

不要花24个月搭建海量的大数据环境,后期再发现这是你最大的错误。可以相当快开始采集数据、建立非完善的数据仓库和做数据分析。这种组建可称为数据灯塔,先关注三大趋势:

- 发现以前未知的走势或关键驱动因素
- 摸索异常的记录
- 理解数据中的相关性
覆盖率有可能不完善,但获取一些立竿见影的成果和指引后期的扩展。关键是一开始得考虑规划扩展性和灵活性的选择。

2. 建立大数据思考

Avinash Kaushik,一位数字分析的专家,倡导采用框架的数字营销计量模型确保数据分析项目针对公司最重要的业务(请查看Avinash所整理的以下例子)。此外,你必须与高层有共识,不需太细,但在一页面总结明确的业务目标与实现。

这里写图片描述

3. 如果大数据思考比大数据技术更重要,那么在技术方面我们又能做些什么呢?

当你的公司使用免费的用户分析平台,如Google Analytics或友盟,你的数据将是产品,为厂家建立附加值(如谷歌Adsense)。由于虚拟商业模式抄袭是市场最隆重的赞美,自部署或在私人化的部署越主流以保障数据安全和灵活融合数据。

4. 先追求正确的时刻获取数据,而不是实时数据

建议你先彻底了解你的公司目前如何组织数据,然后把数字数据融入现有流程。始终目标是如何匹配数据传化成见解和洞察。如果实时数据没创造业务价值,你何必投入资源实现呢?而且你的公司将省很多钱,因为海量的实时数据肯定不便宜!

5. 数据质量差,但还是得做业务决定。

我们的目标应该是尽可能地采集、处理和存储数据。这流程可能不完善,但数字数据仍然具有价值。因为相对于任何的传统来源,数字数据让你建立最完善的用户画面与传化。

数字数据质量确实有优化的空间,如何处理视频或眼花缭乱的社会媒体平台。但市场不会等你做这些优化,所以开始凭数据做小决定。记住,即使这些决定将是革命性的,因为数字与传统数据集在好多公司从来没集合!随着经验的累计和了解数据的限制,你将可以做更多附加值的决定。

6. 消除噪音比找到信号更有价值。

到目前为止,我们查询的目标是从所有噪音摸索有价值的信号。以掌握正确的信号,前提包括清晰的研究问题、数据规模较小、数据集更完整。

已知的已知模式(来自TextOre)
这里写图片描述

六个简单的规则,让你们革命者遵循,确保,革命成功。

这六条规则正在解决首席执行官的问题,而不是CIO或CTO。因此,所思考的的问题较宏观。此外,讨论大数据之前,我建议先建立扎实的基础,通过大数据思考并搭建数据灯塔。

转载地址:http://edadi.baihongyu.com/

你可能感兴趣的文章
设置MYSQL最大连接数与WAIT_TIMEOUT
查看>>
java根据ip地址获取详细地域信息
查看>>
解决s:iterator嵌套s:radio的传值问题
查看>>
位运算-不用加减乘除做加法。
查看>>
C++继承的三种方式(公有,私有,保护)
查看>>
待修改:C++多线程编程学习笔记
查看>>
冒泡、选择、插入、归并
查看>>
QTextEdit显示超链接
查看>>
使用socket下载文件(C++)
查看>>
cent os6.5静默安装oracle
查看>>
cent os6.5搭建oracle-dataguard
查看>>
使easyui-tree显示到指定层次
查看>>
给easyui-input元素添加js原生方法
查看>>
动态规划-最长公共子序列LCS
查看>>
动态规划-矩阵最小路径和
查看>>
动态规划-最长递增子序列
查看>>
spdlog输出格式设置
查看>>
ffmpeg-设置推流,拉流使用的协议类型(TCP/UDP)
查看>>
ffmpeg- 部分错误码-av_interleaved_write_frame/av_write_frame
查看>>
Python3 Flask离线安装
查看>>