PyTorch资源

探索与 PyTorch 相关的精选开源项目、速读教程和最新工作机会

相关开源项目

基于Gradio的Stable Diffusion WebUI,支持txt2img、img2img、修复、放大、图生图、负面提示、自定义脚本、模型融合及社区扩展,提供完整图像生成与编辑功能。

Python
PyTorch
35.7 MB
2026-03-02
Transformers logo

huggingface/transformers

161.5k
33.5k
2.4k

为文本、视觉、音频及多模态模型提供最先进的预训练模型,支持推理与训练,统一模型定义,兼容主流训练框架与推理引擎。

Python
PyTorch
大语言模型
491.5 MB
2026-06-10
Comfyui logo

comfy-org/comfyui

116.4k
13.6k
4.1k

最强大的模块化视觉AI引擎与应用,基于节点/流程图界面,支持Windows、Linux、macOS。无需编码即可设计和执行高级Stable Diffusion工作流,兼容多种图像、视频模型。

Python
PyTorch
88.3 MB
2026-06-10
Llms From Scratch logo

rasbt/llms-from-scratch

96.9k
14.8k
2

从零开始用PyTorch实现类ChatGPT的大语言模型,包含预训练和微调代码。与同名书籍配套,提供完整Jupyter Notebook教程。

Jupyter Notebook
PyTorch
大语言模型
15.7 MB
2026-06-02
Vllm logo

vllm-project/vllm

82.4k
17.9k
5.3k

高性能、内存高效的LLM推理与服务引擎。支持PagedAttention、连续批处理、量化及多种硬件,提供OpenAI兼容API。易于集成HuggingFace模型,适用于高吞吐量场景。

Python
PyTorch
大语言模型
213.1 MB
2026-06-10

提供60+深度学习论文的PyTorch实现与并排注释,涵盖Transformer、优化器、GAN、强化学习等,帮助理解算法。

Python
PyTorch
152.7 MB
2026-01-22
Keras logo

keras-team/keras

64.1k
19.7k
173

多后端深度学习框架,支持JAX、TensorFlow、PyTorch和OpenVINO。提供高级API,加速模型开发,性能领先,支持从笔记本到数据中心的大规模训练。

Python
PyTorch
TensorFlow
52.7 MB
2026-06-10

基于Python的实时语音克隆工具,5秒音频即可克隆声音,支持任意文本实时合成语音。集成SV2TTS框架,包含编码器、合成器和声码器,支持GPU加速。

Python
PyTorch
TensorFlow
361.1 MB
2026-03-09
Ultralytics logo

ultralytics/ultralytics

58.2k
11.2k
325

基于Python的高性能YOLO系列模型库,支持目标检测、跟踪、分割、分类与姿态估计。提供快速、准确、易用的SOTA模型,持续更新优化。

Python
PyTorch
55.9 MB
2026-06-10
Yolov5 logo

ultralytics/yolov5

57.5k
17.5k
44

基于 PyTorch 的实时目标检测框架,支持 ONNX、CoreML、TFLite 部署,速度快、精度高,适用于多种视觉 AI 任务。

Python
PyTorch
17.2 MB
2026-06-10

学习设计、开发、部署和迭代生产级机器学习应用。涵盖从实验到生产的全流程,结合软件工程最佳实践,提供可扩展的MLOps解决方案。

Jupyter Notebook
PyTorch
大语言模型
3.4 MB
2026-03-05
Tts logo

coqui-ai/tts

45.5k
6.1k
8

一个用于文本到语音的深度学习工具包,支持1100多种语言的预训练模型,提供训练和微调工具,已在研究和生产中得到验证。

Python
PyTorch
166.2 MB
2024-08-16
Supervision logo

roboflow/supervision

43.2k
3.8k
102

提供可复用的计算机视觉工具,支持多种模型和数据集操作,包含丰富的可视化标注器,适用于Python 3.9+环境。

Python
PyTorch
TensorFlow
3345.4 MB
2026-06-10
Ray logo

ray-project/ray

42.8k
7.7k
3.5k

统一的AI计算引擎,包含核心分布式运行时与AI库,支持从笔记本到集群的无缝扩展,适用于Python应用与机器学习工作负载。

Python
PyTorch
TensorFlow
大语言模型
725.8 MB
2026-06-10
Deepspeed logo

deepspeedai/deepspeed

42.5k
4.9k
1.3k

深度学习优化库,简化分布式训练与推理,提升效率与规模。支持ZeRO、3D并行等创新技术,已用于训练MT-530B、BLOOM等超大规模模型。

Python
PyTorch
240.7 MB
2026-06-10
Gfpgan logo

tencentarc/gfpgan

37.5k
6.3k
404

基于预训练人脸GAN实现真实世界人脸修复的实用算法。提供多种模型版本,支持CPU运行及非人脸区域增强。

Python
PyTorch
5.3 MB
2024-07-27
Mockingbird logo

babysor/mockingbird

36.9k
5.2k
482

5秒克隆声音,实时生成任意语音。基于Python与PyTorch,支持多语言数据集,兼容Windows/Linux/Mac,提供Web服务接口。

Python
PyTorch
127.7 MB
2026-03-03

PyTorch图像模型集合,提供训练、评估、推理脚本及预训练权重,涵盖ResNet、ViT、EfficientNet等主流架构。

Python
PyTorch
30.2 MB
2026-06-04
Real Esrgan logo

xinntao/real-esrgan

35.7k
4.4k
639

基于纯合成数据训练的通用图像/视频修复实用算法,支持动漫视频与插图超分,提供多种预训练模型与便携执行文件。

Python
PyTorch
5.4 MB
2024-08-06
Diffusers logo

huggingface/diffusers

33.8k
7.0k
1.2k

基于 PyTorch 的先进扩散模型库,支持图像、视频和音频生成。提供预训练管道、可互换调度器和模块化模型,便于快速推理与自定义训练。

Python
PyTorch
97.4 MB
2026-06-10
Netron logo

lutzroeder/netron

33.1k
3.1k
18

可视化神经网络、深度学习和机器学习模型,支持ONNX、TensorFlow、PyTorch等多种格式,提供桌面和浏览器版本。

JavaScript
PyTorch
TensorFlow
95.8 MB
2026-06-09
Mmdetection logo

open-mmlab/mmdetection

32.7k
9.8k
2.0k

基于PyTorch的开源目标检测工具箱,支持目标检测、实例分割、全景分割等多种任务,模块化设计便于扩展。

Python
PyTorch
63.3 MB
2024-08-21
Pytorch Tutorial logo

yunjey/pytorch-tutorial

32.4k
8.2k
88

为深度学习研究者提供PyTorch教程,包含基础、中级、高级模型实现,代码简洁,支持快速上手。

Python
PyTorch
12.8 MB
2023-08-15
Fairseq logo

facebookresearch/fairseq

32.2k
6.7k
1.4k

Facebook AI Research 开发的 Python 序列建模工具包,支持翻译、摘要、语言建模等任务,提供多种神经网络模型实现。

Python
PyTorch
25.5 MB
2025-09-30

基于PyTorch的深度学习框架,无需修改代码即可在1到10,000+ GPU上预训练和微调任意规模的AI模型。提供LitServe用于构建纯Python推理服务器。

Python
PyTorch
130.6 MB
2026-06-10
Easyocr logo

jaidedai/easyocr

29.6k
3.6k
528

支持80+语言的即用型OCR库,涵盖拉丁、中文、阿拉伯文等主流书写系统。Python实现,集成Hugging Face Spaces演示,提供命令行工具与自定义模型训练支持。

Python
PyTorch
157.8 MB
2025-12-05
D2L En logo

d2l-ai/d2l-en

29.0k
5.1k
192

开源交互式深度学习书籍,整合多框架代码、数学与讨论。被全球 500 所大学采用,包括斯坦福、MIT、哈佛和剑桥。提供可运行代码,支持快速学习与实践。

Python
PyTorch
TensorFlow
310.5 MB
2024-08-18
Insightface logo

deepinsight/insightface

28.9k
6.0k
1.3k

顶尖的 2D 和 3D 人脸分析项目,提供人脸检测、识别、交换及 3D 重建等核心功能。基于 Python 开发,拥有超过 2.7 万星标。

Python
PyTorch
59.1 MB
2026-05-23
Voxcpm logo

openbmb/voxcpm

28.1k
3.2k
121

基于 MiniCPM-4 的无分词器 TTS 系统,支持上下文感知语音生成与零样本克隆。采用端到端扩散自回归架构,直接从文本生成连续语音表示,实现高表现力与自然度。支持高效流式合成,RTF 低至 0.15,适用于实时应用。

Python
PyTorch
4.0 MB
2026-06-10

基于 SoftVC VITS 的开源歌声转换项目,支持将任意声音转换为目标歌手音色。提供可视化 f0 编辑器与混音时间线,支持 ONNX 模型。

Python
PyTorch
10.9 MB
2023-11-11