最新发布第12页

过往记忆专注于大数据技术构架及应用，微信公众号:过往记忆大数据

最热排行榜

浏览 (139068)473喜欢
1Hive数据类型转换
浏览 (115400)86喜欢
2Hive常用字符串函数
浏览 (101862)66喜欢
3Hive insert into语句用法
浏览 (92499)179喜欢
4Hive常用函数大全一览
浏览 (92335)128喜欢
5Hive几种数据导入方式
浏览 (90814)75喜欢
6Apache Spark SQL自适应执行实践
浏览 (87768)294喜欢
7精心收集的Hadoop学习资料(持续更新)
浏览 (84594)69喜欢
8使用HttpClient通过post方式发送json数据
浏览 (83525)88喜欢
9Spark: sortBy和sortByKey函数详解
浏览 (83514)73喜欢
10Hive:ORC File Format存储格式详解

Apache Flink 在 bilibili 的优化与实践

导读：本文主要介绍Flink实时计算在bilibili的优化，将从以下四个方面展开： 1、Flink-connector稳定性优化 2、Flink sql优化 3、Flink-runtime优化 4、对未来的展望如果想及时了解Spark、Hadoop或者HBase相关的文章，欢迎关注微信公众号：过往记忆大数据概述首先介绍下Flink实时计算在b站的应用场景。在b站，Flink on yarn

w397090770 3年前 (2021-09-23) 782℃ 0评论2喜欢

Hadoop

LinkedIn 是如何将 Hadoop YARN 集群扩展到超过一万个节点

在 LinkedIn，我们使用 Hadoop 作为大数据分析和机器学习的基础组件。随着数据量呈指数级增长，并且公司在机器学习和数据科学方面进行了大量投资，我们的集群规模每年都在翻倍，以匹配计算工作负载的增长。我们最大的集群现在有大约 10,000 个节点，是全球最大（如果不是最大的）Hadoop 集群之一。多年来，扩展 Hadoop YARN 已成为

w397090770 3年前 (2021-09-18) 499℃ 0评论2喜欢

Spark

Magnet：LinkedIn 开源的可扩展、高性能的 Apache Spark shuffle 服务

在 LinkedIn，我们非常依赖离线数据分析来进行数据驱动的决策。多年来，Apache Spark 已经成为 LinkedIn 的主要计算引擎，以满足这些数据需求。凭借其独特的功能，Spark 为 LinkedIn 的许多关键业务提供支持，包括数据仓库、数据科学、AI/ML、A/B 测试和指标报告。需要大规模数据分析的用例数量也在快速增长。从 2017 年到现在，LinkedIn 的 S

w397090770 3年前 (2021-09-08) 889℃ 0评论4喜欢

Presto

Presto 在腾讯资讯业务中的应用

文章来源团队：腾讯医疗资讯与服务部-技术研发中心前言：随着产品矩阵和团队规模的扩张，跨业务、APP的数据处理、分析总是不可避免。一个显而易见的问题就是异构数据源的连通。我们基于PrestoDB构建了业务线内适应腾讯生态的联邦查询引擎，连通了部门内部20+数据源实例，涵盖了90%的查询场景。同时，我们参与公司级的Pre

w397090770 3年前 (2021-09-08) 466℃ 0评论1喜欢

资料分享

一篇文章理清 NVMe 的前生今世

NVMe是Non-Volatile Memory express(非易失性内存主机控制器接口规范)的简称，它是一种协议，能够使固态硬盘(SSD)运行得更快，如今在企业用户中已越来越流行。理解什么是NVMe的最简单的方法就是打个比方——假设你刚买了一辆跑车，速度能达到400公里每小时，是你以前那辆老汽车的3到4倍。唯一的问题是，普通的道路是无法允许以这

w397090770 3年前 (2021-09-07) 578℃ 0评论1喜欢

Uber

Uber 是如何减少大数据平台的成本

随着 Uber 业务的扩张，为其提供支持的基础数据呈指数级增长，因此处理成本也越来越高。当大数据成为我们最大的运营开支之一时，我们开始了一项降低数据平台成本的举措，该计划将挑战分为三部分：平台效率、供应和需求。本文将讨论我们为提高数据平台效率和降低成本所做的努力。如果想及时了解Spark、Hadoop或者HBase

w397090770 3年前 (2021-09-05) 363℃ 0评论2喜欢

ClickHouse

京东 ClickHouse 高可用实践

导读：京东OLAP采取ClickHouse为主Doris为辅的策略，有3000台服务器，每天亿次查询万亿条数据写入，广泛服务于各个应用场景，经过历次大促考验，提供了稳定的服务。本文介绍了ClickHouse在京东的高可用实践，包括选型过程、集群部署、高可用架构、问题和规划。如果想及时了解Spark、Hadoop或者HBase相关的文章，欢迎关注微信公共帐

w397090770 3年前 (2021-09-03) 636℃ 0评论0喜欢

Flink

Apache Flink 1.14 新特性介绍

一、简介1.14 新版本原本规划有 35 个比较重要的新特性以及优化工作，目前已经有 26 个工作完成；5 个任务不确定是否能准时完成；另外 4 个特性由于时间或者本身设计上的原因，会放到后续版本完成。[1]如果想及时了解Spark、Hadoop或者HBase相关的文章，欢迎关注微信公共帐号：过往记忆大数据1.14 相对于历届版本来说，囊

w397090770 3年前 (2021-09-02) 626℃ 0评论1喜欢

Presto

Presto 在美图的实践

导读：本文的主题是Presto高性能引擎在美图的实践，首先将介绍美图在处理ad-hoc场景下为何选择Presto，其次我们如何通过外部组件对Presto高可用与稳定性的增强。然后介绍在美图业务中如何做到合理与高效的利用集群资源，最后如何利用Presto应用于部分离线计算场景中。使大家了解Presto引擎的优缺点，适合的使用场景，以及在美图

w397090770 3年前 (2021-09-01) 665℃ 0评论1喜欢

Scala

《Get Programming with Scala》于2021年7月由 Manning 出版，ISBN 为 9781617295270 全书共 560 页。如果想及时了解Spark、Hadoop或者HBase相关的文章，欢迎关注微信公众号：iteblog_hadoop图书介绍The perfect starting point for your journey into Scala and functional programming.In Get Programming in Scala you will learn:Object-oriented principles in ScalaExpress program designs in fun

w397090770 3年前 (2021-08-30) 314℃ 0评论3喜欢

上一页
1
···
7
8
9
10
11
12
13
14
15
16
17
...
139
下一页
共 139 页