Apache

#Apache#

已有4人关注此标签

内容分类

阿里云实时计算Flink

阿里云实时计算 Flink 版:基于 Apache Flink 构建的大数据计算平台

实时计算 Flink版是阿里云提供的基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由Apache Flink创始团队官方出品。

阿里云E-MapReduce团队

深入研究Apache Spark 3.0的新功能

分享嘉宾 Apache Spark PMC李潇,就职于 Databricks,Spark 研发部主管,领导 Spark,Koalas,Databricks runtime,OEM 的研发团队,在直播中为大家深入讲解了Apache Spark 3.0的新功能。

阿里云E-MapReduce团队

稳赚不赔~Spark社区招募志愿者!

可能是21世纪唯一不看颜值只看人品的招募

谙忆

1.2 了解MyBatis -《SSM深入解析与项目实战》

1.2 了解MyBatis -《SSM深入解析与项目实战》

云栖号资讯小哥

吃惊!难道Java也受美国出口管制?

今天,去翻看了一下Oracle Jdk的许可协议,竟然是受美国出口管制。

阿里云文档

【最佳实践】Elasticsearch Java Rest Client快速上手(附完整示例代码包)

本文介绍Elasticsearch的Java Client的原理、版本兼容性以及使用示例,帮助您快速使用Java客户端与Elasticsearch集群进行交互,完成检索、分析等相关业务。

云栖号资讯小哥

Java 各类日志组件分析汇总

作为一名开发人员,相信大家对日志工具不会陌生,Java 也拥有功能和性能都非常强大的日志库;不过这么多日志工具 & 第三方的包,怎样保证每个组件里都能使用约定好的日志工具?本文将和大家介绍一下 Java 主流的日志工具,以及相对应的使用场景。

程序猿DD

Spring Cloud 和 Dubbo 哪个会被淘汰?

今天在知乎上看到了这样一个问题:Spring Cloud 和 Dubbo哪个会被淘汰?看了几个回答,都觉得不在点子上,所以要么就干脆写篇小文瞎逼叨一下。

云栖号资讯小哥

从未如此简单:10分钟带你逆袭Kafka!

云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 【编者的话】Apache Kafka 是一个快速、可扩展的、高吞吐的、可容错的分布式“发布-订阅”消息系统, 使用 Scala 与 Java 语言编写,能够将消息从一个端点传递到另一个端点。

小生生

一文告诉你什么是E-MapReduce

阿里云E-MapReduce(Elastic MapReduce),是运行在阿里云平台上的一种大数据处理的系统解决方案。

阿里云实时计算Flink

高能预警!Apache Flink Meetup · 上海站返场啦

英特尔、小红书、唯品会、蚂蚁金服以及阿里巴巴的五位技术专家齐聚上海,线下跟大家分享近期 Flink 的最新应用实践与最新社区动态。

阿里云实时计算Flink

Flink 1.11 新特性之 SQL Hive Streaming 简单示例

Flink 1.11 的 Hive Streaming 功能大大提高了 Hive 数仓的实时性,对 ETL 作业非常有利,同时还能够满足流式持续查询的需求,具有一定的灵活性。

阿里云实时计算Flink

Flink 1.11:更好用的流批一体 SQL 引擎

在保证优秀性能的同时,易用性是 1.11 版本 Flink SQL 的重头戏。易用性的提升主要体现在以下几个方面:更方便的追加或修改表定义、灵活的声明动态的查询参数、加强和统一了原有 TableEnv 上的 SQL 接口、简化了 connector 的属性定义、对 Hive 的 DDL 做了原生支持、加强了对 python UDF 的支持。

阿里云实时计算Flink

官宣 | 千呼万唤,Apache Flink 1.11.0 正式发布啦!

Apache Flink 社区很荣幸的宣布 Flink 1.11.0 版本正式发布!超过 200 名贡献者参与了 Flink 1.11.0 的开发,提交了超过 1300 个修复或优化。这些修改极大的提高了 Flink 的可用性,并且增强了各个 API 栈的功能。

云栖号资讯小编

有哪些大数据处理工具?

本文分享作者在大数据系统实践过程中接触过的一些工具及使用感受,抛砖引玉,和同学们一起构建一个分布式产品的全景图。

林明

Phoenix索引构建最佳实践

介绍三种的不同的索引构建方法及其适用场景

淘系技术

Java 日志框架解析:汇总及最佳实践

在java的世界里有许多实现日志功能的工具,最早得到广泛使用的是 log4j,现在比较流行的是slf4j+logback。作为开发人员,我们有时候需要封装一些组件(二方包)提供给其他人员使用,但是那么多的日志工具,根本没法保证每个组件里都能使用约定好的日志工具,况且还有很多第三方的包,鬼知道他会用什么日志工具。

开源大数据EMR

Apache Spark 3.0 中的向量化 IO

在 Apache Spark 3.0 中,SparkR 中引入了一种新的向量化(vectorized)实现,它利用 Apache Arrow 直接在 JVM 和 R 之间交换数据,且(反)序列化成本非常小

开源大数据EMR

7月23日社区直播【TFPark: Distributed TensorFlow in Production on Apache Spark】

TFPark是开源AI平台Analytics Zoo中一个模块,它的可以很方便让用户在Spark集群中分布式地进行TensorFlow模型的训练和推断。一方面,TFPark利用Spark将TensorFlow 定义的AI训练或推理任务无缝的嵌入到用户的大数据流水线中,而无需对现有集群做任何修改;另一方面TFPark屏蔽了复杂的分布式系统逻辑,可以将单机开发的AI应用轻松扩展到几十甚至上百节点上。