探索 Spark 项目

筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。

找到 33 个项目 | 数据更新于:2026-06-10 19:03
Lakefs logo
5.4k
📝 Go

lakeFS 是开源数据湖版本控制工具,提供类 Git 的数据管理能力。支持 AWS S3、Azure Blob Storage 和 Google Cloud Storage,兼容 S3 API,可与 Spark、Hive 等框架无缝集成。实现可重复、原子性的数据湖操作,适用于 ETL 测试、数据科学和分析。

Spark
Git
大语言模型
📦 173.5 MB
🕐 2026-06-09
已收藏!可在"我的账户"中查看
Synapseml logo
5.2k
📝 Scala

基于 Apache Spark 的开源库,简化大规模机器学习管道的创建。提供简单、可组合的分布式 API,支持文本分析、视觉、异常检测等任务。兼容 Python、R、Scala、Java 和 .NET,可无缝集成到现有 Spark 工作流中。

Spark
📦 176.9 MB
🕐 2026-05-30
已收藏!可在"我的账户"中查看
Cube Studio logo
5.0k
📝 Python

开源云原生一站式 AI 平台,支持 MLOps 全流程、分布式训练、超参搜索、推理服务 VGPU 虚拟化、大模型微调与多机推理,兼容国产硬件及多种框架。

Spark
Kubernetes
PyTorch
📦 150.4 MB
🕐 2026-05-20
已收藏!可在"我的账户"中查看