探索项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
DataTalksClub/data-engineering-zoomcamp
数据工程Zoom训练营是一个为期九周的免费课程,涵盖数据工程的基础知识。
apache/kafka
Apache Kafka 的镜像仓库
pathwaycom/pathway
用于流处理、实时分析、LLM 管道和 RAG 的 Python ETL 框架。
yudaocode/SpringBoot-Labs
一个涵盖六个专栏:Spring Boot 2.X、Spring Cloud、Spring Cloud Alibaba、Dubbo、分布式消息队列、分布式事务的仓库。希望胖友小手一抖,右上角来个 Star,感恩 1024
thingsboard/thingsboard
开源物联网平台 - 设备管理、数据收集、处理与可视化。
heibaiying/BigData-Notes
大数据入门指南 🌟
influxdata/telegraf
用于收集、处理、聚合和写入指标、日志及其他任意数据的代理程序。
zhisheng17/flink-learning
Flink 学习博客:http://www.54tianzhisheng.cn/,包含 Flink 入门、概念、原理、实战、性能调优、源码解析等内容。涵盖 Flink Connector、Metrics、Library、DataStream API、Table API & SQL 等相关学习案例,同时分享 Flink 落地应用的大型项目案例(如 PVUV、日志存储、百亿数据实时去重、监控告警)。欢迎关注我的专栏《大数据实时计算引擎 Flink 实战与性能优化》
aalansehaiyang/technology-talk
【大厂面试专栏】一份Java程序员需要的技术指南,这里有面试题、系统架构、职场锦囊、主流中间件等,让你成为更牛的自己!
sogou/workflow
C++ 并行计算与异步网络框架
IBM/sarama
Sarama 是一个用于 Apache Kafka 的 Go 语言库。
yahoo/CMAK
CMAK 是一个用于管理 Apache Kafka 集群的工具
debezium/debezium
用于多种数据库的变更数据捕获。请在 https://issues.redhat.com/browse/DBZ 提交问题。
kubeshark/kubeshark
Kubernetes 的 API 流量分析工具,提供实时的 K8s 协议级可见性,捕获并监控进出容器、Pod、节点和集群的所有流量和负载。受 Wireshark 启发,专为 Kubernetes 构建。
provectus/kafka-ui
开源的 Apache Kafka 管理 Web UI
redpanda-data/redpanda
Redpanda 是一个为开发者提供的流数据平台。与 Kafka API 兼容,速度快 10 倍,无需 ZooKeeper,无需 JVM!
wangzhiwubigdata/God-Of-BigData
专注大数据学习面试,大数据成神之路开启。Flink/Spark/Hadoop/Hbase/Hive...
ThreeDotsLabs/watermill
用简单的方式在 Go 中构建事件驱动型应用。
redpanda-data/connect
复杂流处理变得操作简单
segmentio/kafka-go
用Go语言编写的Kafka库
risingwavelabs/risingwave
流处理和管理平台。
Graylog2/graylog2-server
免费且开源的日志管理
didi/KnowStreaming
一站式云原生实时流数据平台,通过0侵入、插件化构建企业级Kafka服务,极大降低操作、存储和管理实时流数据门槛
dotnetcore/CAP
基于最终一致性在微服务中的分布式事务解决方案,同时也是一种采用 Outbox 模式的事件总线。
HariSekhon/DevOps-Bash-tools
1000+ DevOps Bash 脚本 - AWS、GCP、Kubernetes、Docker、CI/CD、API、SQL、PostgreSQL、MySQL、Hive、Impala、Kafka、Hadoop、Jenkins、GitHub、GitLab、BitBucket、Azure DevOps、TeamCity、Spotify、MP3、LDAP、代码/构建检查、Linux、Mac、Python、Perl、Ruby、NodeJS、Golang 的包管理,高级配置文件:.bashrc、.vimrc、.gitconfig、.screenrc、tmux..
robinhood/faust
Python流处理
AutoMQ/automq
AutoMQ 是一个无状态/无磁盘的基于 S3 的 Kafka。成本效益提高 10 倍。无跨可用区流量费用。秒级自动扩展。个位数毫秒级延迟。多可用区高可用性。
CoderLeixiaoshuai/java-eight-part
『Java八股文』Java面试套路,Java进阶学习,打破内卷拿大厂Offer,升职加薪!
apache/flink-cdc
Flink CDC 是一个流式数据集成工具
MaterializeInc/materialize
实时数据集成与转换:使用SQL转换、交付并处理快速变化的数据。