5997794 openlookeng 1598665874
72
openLooKeng is a drop in engine which enables in-situ analytics on any data, anywhere, including geographically remote data sources.
1 day ago 105 issues
5460443 baidu 1578992824
52
Apache Doris (incubating)(原Palo)是一款百度大数据团队自主研发的MPP数据库
3 days ago
12 mirrors 1578989292
3
Hibench 是一个大数据基准测试套件,用来测试框架的速度、吞吐率与资源利用率等
3 days ago
12 mirrors 1578989292
12
Apache NiFi 是一个易于使用、功能强大而且可靠的数据处理和分发系统
3 days ago
12 mirrors 1578989292
6
Brooklin 是一种近实时的大规模数据流分布式服务,LinkedIn 自 2016 年以来一直在使用这项服务,支撑每天数千个数据流和超过 2 万亿条消息
3 days ago
12 mirrors 1578989292
3
Hudi 于 2016 年以“Hoodie”为代号开发,旨在解决 Uber 大数据生态系统中需要插入更新及增量消费原语的摄取管道和 ETL 管道的低效问题
3 days ago
12 mirrors 1578989292
4
Alluxio(之前名为Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统
3 days ago
12 mirrors 1578989292
9
Apache Fluo 是  Google Percolator(搜索索引)的开源实现,允许用户对存储在 Apache Accumulo 中的大型数据集进行增量更新,而无需重新处理
3 days ago
12 mirrors 1578989292
8
AthenaX 是 Uber 的内部流分析平台,旨在满足以下需求并为每一个人提供可访问的流分析能力: (1)轻松为各类用户提供导航服务,而无需对其技术背景提出任何要求 ; (2)以
3 days ago
12 mirrors 1578989292
19
HAWQ 是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库类似,接受SQL,返回结果集。
3 days ago
12 mirrors 1578989292
141
Apache Flink 是高效和分布式的通用数据处理平台
3 days ago
20
OSSEAN是一个全球开源软件实时分析监测系统,通过对全球主流开源社区进行持续数据实时采集和跨社区深度关联分析,提供开源项目检索、评估和排行等服务。
10 days ago 1 issue
0
COOPER 平台通过分析软件开发者大数据对开发者进行全方位画像和协作关系分析,并构建软件开发者知识图谱,在此基础上提供开发者和开发资源的智能搜索与推荐服务
12 days ago
319685 bboss 1578989326
3
kafka-elasticsearch数据同步工具
17 days ago
319685 bboss 1578989326
61
数据交换模块
17 days ago

Search

132457 8cb2edc1 1899542 131848 70c8d3a4 1899542