PyTorch 开源项目、教程与资源

automatic1111/stable-diffusion-webui

164.3k

30.4k

2.5k

基于Gradio的Stable Diffusion WebUI，支持txt2img、img2img、修复、放大、图生图、负面提示、自定义脚本、模型融合及社区扩展，提供完整图像生成与编辑功能。

Python

PyTorch

35.7 MB

2026-03-02

huggingface/transformers

163.1k

34.1k

2.3k

为文本、视觉、音频及多模态模型提供最先进的预训练模型，支持推理与训练，统一模型定义，兼容主流训练框架与推理引擎。

Python

PyTorch

大语言模型

495.3 MB

2026-07-28

comfy-org/comfyui

122.6k

14.5k

4.4k

最强大的模块化视觉AI引擎与应用，基于节点/流程图界面，支持Windows、Linux、macOS。无需编码即可设计和执行高级Stable Diffusion工作流，兼容多种图像、视频模型。

Python

PyTorch

90.3 MB

2026-07-28

rasbt/llms-from-scratch

100.0k

15.4k

2

从零开始用PyTorch实现类ChatGPT的大语言模型，包含预训练和微调代码。与同名书籍配套，提供完整Jupyter Notebook教程。

Jupyter Notebook

PyTorch

大语言模型

16.5 MB

2026-07-27

vllm-project/vllm

87.5k

20.0k

6.1k

高性能、内存高效的LLM推理与服务引擎。支持PagedAttention、连续批处理、量化及多种硬件，提供OpenAI兼容API。易于集成HuggingFace模型，适用于高吞吐量场景。

Python

PyTorch

大语言模型

245.5 MB

2026-07-29

labmlai/annotated_deep_learning_paper_implementations

67.2k

6.7k

34

提供60+深度学习论文的PyTorch实现与并排注释，涵盖Transformer、优化器、GAN、强化学习等，帮助理解算法。

Python

PyTorch

152.7 MB

2026-01-22

keras-team/keras

64.2k

19.7k

219

多后端深度学习框架，支持JAX、TensorFlow、PyTorch和OpenVINO。提供高级API，加速模型开发，性能领先，支持从笔记本到数据中心的大规模训练。

Python

PyTorch

TensorFlow

53.0 MB

2026-07-29

corentinj/real-time-voice-cloning

60.1k

9.4k

175

基于Python的实时语音克隆工具，5秒音频即可克隆声音，支持任意文本实时合成语音。集成SV2TTS框架，包含编码器、合成器和声码器，支持GPU加速。

Python

PyTorch

TensorFlow

361.1 MB

2026-03-09

ultralytics/ultralytics

60.0k

11.5k

150

基于Python的高性能YOLO系列模型库，支持目标检测、跟踪、分割、分类与姿态估计。提供快速、准确、易用的SOTA模型，持续更新优化。

Python

PyTorch

59.7 MB

2026-07-29

ultralytics/yolov5

57.8k

17.5k

30

基于 PyTorch 的实时目标检测框架，支持 ONNX、CoreML、TFLite 部署，速度快、精度高，适用于多种视觉 AI 任务。

Python

PyTorch

17.7 MB

2026-07-29

gokumohandas/made-with-ml

48.9k

7.7k

27

学习设计、开发、部署和迭代生产级机器学习应用。涵盖从实验到生产的全流程，结合软件工程最佳实践，提供可扩展的MLOps解决方案。

Jupyter Notebook

PyTorch

大语言模型

3.4 MB

2026-03-05

roboflow/supervision

48.4k

4.5k

81

提供可复用的计算机视觉工具，支持多种模型和数据集操作，包含丰富的可视化标注器，适用于Python 3.9+环境。

Python

PyTorch

TensorFlow

3657.9 MB

2026-07-28

coqui-ai/tts

45.8k

6.2k

4

一个用于文本到语音的深度学习工具包，支持1100多种语言的预训练模型，提供训练和微调工具，已在研究和生产中得到验证。

Python

PyTorch

166.2 MB

2024-08-16

ray-project/ray

43.4k

7.8k

3.5k

统一的AI计算引擎，包含核心分布式运行时与AI库，支持从笔记本到集群的无缝扩展，适用于Python应用与机器学习工作负载。

Python

PyTorch

TensorFlow

大语言模型

750.2 MB

2026-07-29

deepspeedai/deepspeed

42.8k

4.9k

1.3k

深度学习优化库，简化分布式训练与推理，提升效率与规模。支持ZeRO、3D并行等创新技术，已用于训练MT-530B、BLOOM等超大规模模型。

Python

PyTorch

241.4 MB

2026-07-29

tencentarc/gfpgan

37.6k

6.3k

403

基于预训练人脸GAN实现真实世界人脸修复的实用算法。提供多种模型版本，支持CPU运行及非人脸区域增强。

Python

PyTorch

5.3 MB

2024-07-27

huggingface/pytorch-image-models

37.0k

5.2k

61

PyTorch图像模型集合，提供训练、评估、推理脚本及预训练权重，涵盖ResNet、ViT、EfficientNet等主流架构。

Python

PyTorch

30.2 MB

2026-07-28

babysor/mockingbird

36.9k

5.2k

482

5秒克隆声音，实时生成任意语音。基于Python与PyTorch，支持多语言数据集，兼容Windows/Linux/Mac，提供Web服务接口。

Python

PyTorch

127.7 MB

2026-03-03

xinntao/real-esrgan

36.3k

4.4k

645

基于纯合成数据训练的通用图像/视频修复实用算法，支持动漫视频与插图超分，提供多种预训练模型与便携执行文件。

Python

PyTorch

5.4 MB

2024-08-06

openbmb/voxcpm

34.3k

3.9k

99

基于 MiniCPM-4 的无分词器 TTS 系统，支持上下文感知语音生成与零样本克隆。采用端到端扩散自回归架构，直接从文本生成连续语音表示，实现高表现力与自然度。支持高效流式合成，RTF 低至 0.15，适用于实时应用。

Python

PyTorch

4.5 MB

2026-07-08

huggingface/diffusers

34.2k

7.2k

1.3k

基于 PyTorch 的先进扩散模型库，支持图像、视频和音频生成。提供预训练管道、可互换调度器和模块化模型，便于快速推理与自定义训练。

Python

PyTorch

102.8 MB

2026-07-28

lutzroeder/netron

33.3k

3.2k

19

可视化神经网络、深度学习和机器学习模型，支持ONNX、TensorFlow、PyTorch等多种格式，提供桌面和浏览器版本。

JavaScript

PyTorch

TensorFlow

94.4 MB

2026-07-28

open-mmlab/mmdetection

32.8k

9.8k

2.0k

基于PyTorch的开源目标检测工具箱，支持目标检测、实例分割、全景分割等多种任务，模块化设计便于扩展。

Python

PyTorch

63.3 MB

2024-08-21

yunjey/pytorch-tutorial

32.4k

8.2k

90

为深度学习研究者提供PyTorch教程，包含基础、中级、高级模型实现，代码简洁，支持快速上手。

Python

PyTorch

12.8 MB

2023-08-15

facebookresearch/fairseq

32.3k

6.7k

1.4k

Facebook AI Research 开发的 Python 序列建模工具包，支持翻译、摘要、语言建模等任务，提供多种神经网络模型实现。

Python

PyTorch

25.5 MB

2025-09-30

lightning-ai/pytorch-lightning

31.3k

3.8k

1.1k

基于PyTorch的深度学习框架，无需修改代码即可在1到10,000+ GPU上预训练和微调任意规模的AI模型。提供LitServe用于构建纯Python推理服务器。

Python

PyTorch

130.9 MB

2026-07-27

jaidedai/easyocr

29.8k

3.6k

528

支持80+语言的即用型OCR库，涵盖拉丁、中文、阿拉伯文等主流书写系统。Python实现，集成Hugging Face Spaces演示，提供命令行工具与自定义模型训练支持。

Python

PyTorch

157.8 MB

2025-12-05

deepinsight/insightface

29.3k

6.1k

1.3k

顶尖的 2D 和 3D 人脸分析项目，提供人脸检测、识别、交换及 3D 重建等核心功能。基于 Python 开发，拥有超过 2.7 万星标。

Python

PyTorch

60.1 MB

2026-07-27

d2l-ai/d2l-en

29.3k

5.1k

207

开源交互式深度学习书籍，整合多框架代码、数学与讨论。被全球 500 所大学采用，包括斯坦福、MIT、哈佛和剑桥。提供可运行代码，支持快速学习与实践。

Python

PyTorch

TensorFlow

310.5 MB

2024-08-18

svc-develop-team/so-vits-svc

28.2k

5.0k

27

基于 SoftVC VITS 的开源歌声转换项目，支持将任意声音转换为目标歌手音色。提供可视化 f0 编辑器与混音时间线，支持 ONNX 模型。

Python

PyTorch

10.9 MB

2023-11-11

PyTorch资源

相关开源项目

automatic1111/stable-diffusion-webui

huggingface/transformers

comfy-org/comfyui

rasbt/llms-from-scratch

vllm-project/vllm

labmlai/annotated_deep_learning_paper_implementations

keras-team/keras

corentinj/real-time-voice-cloning

ultralytics/ultralytics

ultralytics/yolov5

gokumohandas/made-with-ml

roboflow/supervision

coqui-ai/tts

ray-project/ray

deepspeedai/deepspeed

tencentarc/gfpgan

huggingface/pytorch-image-models

babysor/mockingbird

xinntao/real-esrgan

openbmb/voxcpm

huggingface/diffusers

lutzroeder/netron

open-mmlab/mmdetection

yunjey/pytorch-tutorial

facebookresearch/fairseq

lightning-ai/pytorch-lightning

jaidedai/easyocr

deepinsight/insightface

d2l-ai/d2l-en

svc-develop-team/so-vits-svc