1640228 opensci 1578990842
12
大规模天文巡天观测数据采集、存储与分析系统
C++
3年多前
6892317 apache 1605059459
11
Apache Fluo 是  Google Percolator(搜索索引)的开源实现,允许用户对存储在 Apache Accumulo 中的大型数据集进行增量更新,而无需重新处理
Java
27天前
11
一个用于高性能工作负载场景下基于Kubernetes的容器批量调度引擎 Volcano是在Kubernetes上运行高性能工作负载的容器批量计算引擎。 它提供了Kubernetes目前缺少的一套机制,这些机制通常是许多高性能 工作负载所必需的,包括: - 机器学习/深度学习 - 生物学计算/基因计算 - 大数据应用
4个月前
1116819 hanmov5 1578940692
9
hbase template封装
12 mirrors 1578989292
8
HiPlot 是一款轻巧的交互式可视化工具,可帮助AI研究人员使用并行绘图和其他图形方式,从而发现高维数据中的相关性和模式
Python
3年多前
8
数据清洗工具
Java
4年多前
12 mirrors 1578989292
7
AresDB 是一个基于 GPU 运算的实时分析存储引擎和查询引擎
Go
3年多前
7
A simple Spark-powered ETL framework that just works 🍺
Scala
3年前
6325975 awesome lib 1630500982
7
A curated list of awesome big data frameworks, ressources and other awesomeness.
11个月前
6
这是一个可自由拖拽的BI可视化系统 支持主流的关系数据:MySQL,Oracle,PostgreSQL等 同时支持Apache Doris,这个一开始初衷就是为了 Doris 数据可视化分析做的 后端框架使用了若依
Java
9个月前
6892317 apache 1605059459
6
Apache Mnemonic  是一个面向非易失性混合内存存储的库,它提出了一个非易失性/持久的 Java 对象模型和持久的计算服务,能显着提高了海量实时数据处理/分析的性能
Java
3天前
5
性能监控工具
Java
4年多前
5
故障管理工具开源仓库
Java
4年多前
6841606 bytedance 1661499424
5
BitSail is a distributed, high-performance data integration engine and provides global data integration solutions in batch, streaming, and incremental scenarios. At present, BitSail has been widely used and synchronizes hundreds of trillions data every ...
4个月前
6892317 apache 1605059459
4
Apache Avro™ is a data serialization system.
Java
1天前

搜索帮助