探索项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
AUTOMATIC1111/stable-diffusion-webui
Stable Diffusion 网络界面
huggingface/transformers
🤗 Transformers:用于文本、视觉、音频和多模态模型的推理与训练的前沿机器学习模型定义框架。
comfyanonymous/ComfyUI
功能最强大且模块化的扩散模型图形界面、API 和后端,采用图/节点式界面设计。
keras-team/keras
面向人类的深度学习
labmlai/annotated_deep_learning_paper_implementations
🧑🏫 60+ 深度学习论文的实现与教程,并配有并列笔记 📝;涵盖 Transformer(原始、XL、Switch、Feedback、ViT 等)、优化器(Adam、AdaBelief、Sophia 等)、生成对抗网络(CycleGAN、StyleGAN2 等)、🎮 强化学习(PPO、DQN)、CapsNet、蒸馏模型等 🧠
rasbt/LLMs-from-scratch
从零开始逐步使用 PyTorch 实现一个类似 ChatGPT 的大语言模型(LLM)
CorentinJ/Real-Time-Voice-Cloning
5秒内克隆一个声音,实时生成任意语音
ultralytics/yolov5
YOLOv5 🚀 基于 PyTorch > ONNX > CoreML > TFLite
vllm-project/vllm
一个高吞吐量、内存高效的大型语言模型推理与服务引擎
ultralytics/ultralytics
Ultralytics YOLO11 🚀
coqui-ai/TTS
🐸💬 - 一个用于文本到语音的深度学习工具包,经过研究和生产环境的实战检验
GokuMohandas/Made-With-ML
学习如何设计、开发、部署和迭代生产级机器学习应用程序。
deepspeedai/DeepSpeed
DeepSpeed 是一个深度学习优化库,使分布式训练和推理变得简单、高效且有效。
ray-project/ray
Ray 是一个 AI 计算引擎。Ray 包含一个核心的分布式运行时和一组用于加速机器学习工作负载的 AI 库。
TencentARC/GFPGAN
GFPGAN 旨在开发用于真实世界人脸修复的实用算法。
babysor/MockingBird
🚀AI拟声:5秒内克隆您的声音并生成任意语音内容
huggingface/pytorch-image-models
这是最大的 PyTorch 图像编码器/主干网络集合。包含训练、评估、推理、导出脚本以及预训练权重——涵盖 ResNet、ResNeXT、EfficientNet、NFNet、视觉Transformer(ViT)、MobileNetV4、MobileNet-V3 和 V2、RegNet、DPN、CSPNet、Swin Transformer、MaxViT、CoAtNet、ConvNeXt 等多种模型。
facebookresearch/fairseq
Facebook AI Research 出品的基于 Python 的序列到序列工具包。
xinntao/Real-ESRGAN
Real-ESRGAN 致力于开发通用图像/视频恢复的实用算法。
yunjey/pytorch-tutorial
深度学习研究人员的 PyTorch 教程
open-mmlab/mmdetection
OpenMMLab 检测工具箱与基准测试
lutzroeder/netron
神经网络、深度学习和机器学习模型的可视化工具
Lightning-AI/pytorch-lightning
使用多块 GPU、TPU 预训练、微调任意大小的 AI 模型,无需更改任何代码。
huggingface/diffusers
🤗 Diffusers:基于 PyTorch 和 FLAX 的图像、视频和音频生成领域的最先进扩散模型。
svc-develop-team/so-vits-svc
SoftVC VITS 歌声转换
JaidedAI/EasyOCR
开箱即用的OCR工具,支持80多种语言及所有主流书写脚本,包括拉丁文、中文、阿拉伯文、天城文、西里尔文等。
fastai/fastai
fastai 深度学习库
roboflow/supervision
我们编写可重复使用的计算机视觉工具。💜
d2l-ai/d2l-en
交互式深度学习书籍,包含多框架代码、数学推导与讨论。已被来自70个国家的500所大学采用,包括斯坦福大学、麻省理工学院、哈佛大学和剑桥大学。
deepinsight/insightface
最先进的 2D 和 3D 人脸分析项目