数据

从关系型数据库到分布式机器学习,揭秘腾讯大数据十年发展历程

大数据技术在过去10多年中极大改变了企业对数据的存储、处理和分析方式。如今,大数 … Read More

关于大数据的书写 [提示]

曾经为写什么而挣扎吗?不用担心,我们为您服务。下面是大数据提示和文章创意的列表, … Read More

陶建辉:通过技术“Leave a dent in the world”

“让我们一起奔跑,去追求卓越而不是平庸的一生!”今年8月 … Read More

数据偏移、分区陷阱……我们这样避开DynamoDB的5个坑

摘要:本文主要介绍作者所在团队在具体业务中所遇到的挑战,基于这些挑战为何最终选型 … Read More

核心业务“瘦身”进行时!手把手带你搭建海量数据实时处理架构

01 背景  在线交易服务平台目的是减轻核心系统计算压力和核心性能负荷 … Read More

如何为数据集选择正确的聚类算法

应用聚类算法比选择最佳算法要容易得多。 每种类型都有其优缺点,如果您想要一个整洁 … Read More

面试官问:请介绍一下MySQL数据库的锁机制?

为什么要加锁 问题背景 当多个用户并发地存取数据时,在数据库中就会产生多个事务同 … Read More

滴滴从KV存储到NewSQL实战

桔妹导读:本文讲诉滴滴在分布式Nosql存储Fusion之上构建NewSQL的实 … Read More

TPC-C解析系列04_TPC-C基准测试之数据库事务引擎的挑战

OceanBase这次TPC-C测试与榜单上Oracle和DB2等其他数据库在硬 … Read More

如何使用 AWS 设置数据湖架构

在我们讨论黄铜钉之前,快速列出我们希望理想数据湖提供的具体优势会很有帮助。这些是 … Read More

企业需要知道的 6个AI/ML关键点

由于人工智能(AI)和机器学习(ML)的迅速发展与应用落地,世界各地的公司正在积 … Read More

卡夫卡以外的生活与阿帕奇脉冲星

在我作为解决方案架构师的所有年,我构建了许多流架构,例如实时数据 ETL、反应微 … Read More

通过洗牌和屏蔽数据隐私 – 第 2 部分

在本博客的两部分系列的第一部分中,我们深入探讨了旨在混合数据的数据洗牌技术,同时 … Read More

影响 CRM 数据质量的五个方面

成功进行 CRM/ERP工作的核心要求是存储数据的质量。任何 CRM 系统中,客 … Read More

通过洗牌和屏蔽数据隐私 – 第 1 部分

对于公司来说,保护敏感数据可能是一项具有挑战性的任务。在数据隐私法规不断变化的互 … Read More

影响成功数据管道的三大挑战

仅在过去两年中,全球 90% 的数据就已创建,分析师预计,到 2025 年,全球 … Read More

学习 R 的十大理由

R 编程语言是目前最流行的编程语言之一。因此,R 和其他流行的编程语言(如R v … Read More

数据科学与专业认证日益重要

数据科学家是当今最抢手的技术人才之一。据Glassdoor称,数据科学家已经连续 … Read More

搞个大事情,阿里如何实现上亿级数据的精准计数?

背景 关系型数据库在执行计数任务时,其执行效率会随着数据量级的增长而降低;当数据 … Read More

滴滴海量离线数据的在线化 — FastLoad

桔妹导读:滴滴自成立以来,有海量的数据存储在离线平台,离线数据虽然存储便宜,压缩 … Read More