大数据

#大数据#

已有243人关注此标签

内容分类

shawhang

Data Vault的一点思考

之前参考过很多资料,其主要的核心理念是,DV(Data Vault)是结合ER和DM的一套建模理论。其实与其说是这样,还不如说是ER这一派,想找一个中间地带,两者都能兼顾。最近看了在维基百科看到关于DV的解释,其中提到DM的一段:For this purpose, the hubs and rela...

阿里云头条

这些人的一万五千次努力

一年在学习平台上累计“吸氧”75万小时,67%的人会写代码,作为最有技术范儿的一群“Cool Guy”——阿里云人,最近一年他们做公益的次数,超过了“15000”次。 15000分之一:江豚的100980次出水只剩下1012头江豚了。

云攻略小攻

Hello Better World:这些人的一万五千次努力

1973年,Brian Kernighan编写了一部教授B语言的编程教程,他用“Hello World”唤醒了计算机运行程序的第一步。 2018年,让程序员难掩兴奋的不只是一句象征着编译成功的问候。他们焐热了手中的代码,让这些密密麻麻的小字母,和着世界的心跳,泛出了暖意。

晋恒

数据集成到MaxCompute的N种最佳实践(持续更新)

本文汇总数据集成到MaxCompute的各种最佳实践,希望可以帮助到正在或者即将使用MaxCompute的企业和开发者们。 也欢迎您将有关MaxCompute数据集成的实践分享出来,分享方法可扫码加入钉钉群,联系钉钉群主即可。

cxlwill

30 行 Javascript 代码搞定智能家居系统

本文首发于『阿里云 IoT 开发者社区』,更多精彩物联网内容欢迎前往浏览。 智能家居可谓是今年物联网的热门领域,通过智能单品和智能音箱,人们已然把『智能』两个字变成了生活的理所应当。搭建云上之家除了买买买,还能 DIY。

hbase小能手

HBase+Spark技术双周刊 第二期

精彩直播:HBase生态+Spark社区钉钉大群直播往期回顾——视频回看及PPT下载;线下活动:阿里云栖开发者沙龙;优质博文。

悟冥

SLS机器学习最佳实战:时序预测

通过分析序列进行合理预测,做到提前掌握未来的发展趋势,为业务决策提供依据,这也是决策科学化的前提。 时间序列就是按时间顺序排列的一组数据序列。时间序列分析就是发现这组数据的变动规律并用于预测的统计技术。

云花

【MaxCompute季报】MaxCompute新功能发布 2018Q3

2018年Q3 MaxCompute重磅发布了一系列新功能。 本文对主要新功能和增强功能进行了概述。 实时交互式查询:Lightning on MaxCompute 生态兼容:Spark on MaxCompute New SQL 新特性发布 Python UDF全面开放 OSS外表功能正式商业化.

初雪之路

Python 3.7.1的安装

Python简介 Python是一种跨平台、开源的、免费的、解释型的高级编程语言。应用领域很广泛,用于web开发、大数据处理、人工智能、自动化运维开发、云计算、爬虫、游戏开发等。 一、搭建Python安装环境 Windows:查看Windows系统是32位 或 64位,然后在Python官网下载对应的安装文件。

哈皮阿呆

Elastic Stack实战学习教程~日志数据的收集、分析与可视化

近几年,互联网生成数据的速度不断递增,为了便于用户能够更快更精准的找到想要的内容,站内搜索或应用内搜索成了不可缺少了的功能之一。同时,企业积累的数据也再不断递增,对海量数据分析处理、可视化的需求也越来越高。

金竹

Apache Flink 漫谈系列(01) - 序

本人 孙金城,淘宝花名"金竹",阿里巴巴高级技术专家,Apache Flink Committer。目前就职于阿里巴巴计算平台事业部,自2015年以来一直投入于基于Apache Flink的设计研发工作。

终日而思一

Mysql 流增量写入 Hdfs(一) --从 mysql 到 kafka

一. 概述 在大数据的静态数据处理中,目前普遍采用的是用 Spark + Hdfs (Hive / Hbase) 的技术架构来对数据进行处理。 但有时候有其他的需求,需要从其他不同数据源不间断得采集数据,然后存储到 Hdfs 中进行处理。

taro_秋刀鱼

MQTT获取离线消息小议

微消息队列MQ for IoT在处理离线消息时,为了简化离线消息获取机制,微消息队列系统在客户端成功建立连接并通过权限校验后,会自动加载离线消息并下发到客户端,但是实际在使用过程中会出现消费端启动后迟迟无法获取离线消息的问题,本文主要介绍延迟消息的发送与接收缓解需要注意的问题。

yangbinchen

大数据可视化及发展趋势

本文是我在整理大数据可视化时,针对大数据可视化的一些概念进行了归纳和整理。

小扑

OpenSearch在线干预服务

背景 ​ 阿里云开放搜索OpenSearch是一款阿里巴巴自主研发的大规模分布式搜索引擎平台,该平台承载了淘宝、天猫、1688、神马搜索、口碑、菜鸟等搜索业务,通过OpenSearch云服务的方式,将阿里巴巴成熟的搜索技术共享给广大开发者。

小扑

阿里云Elasticsearch离线平台化建设

阿里云Elasticsearch提供低成本、灵活的分析和搜索服务,很大程度降低了用户的使用成本和运维成本。美中不足的是缺乏数据场景的支持,用户还是需要花很大的精力去解决数据场景的痛点问题,比如 海量数据源如何对接 复杂的数据计算和处理逻辑 全量数据导入影响在线查询 海量数据导入越来越慢 全量/实时数据无损切换 为了帮助用户解决这些痛点问题,阿里云Elasticsearch离线平台应运而生 。

小扑

阿里云Elasticsearch搜索服务框架Shuttle

随着阿里云生态的蓬勃发展,我们看到越来越多的开发者开始基于ECS体系开发自己的分布式应用。的确,阿里云ECS提供的弹性云计算服务、多样化的规格配置支持、安全网络隔离等多种灵活便利的一站式服务,大大降低了用户开发新应用的技术门槛与成本消耗。