PyTorch资源
探索与 PyTorch 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
kornia/kornia
基于 PyTorch 的可微分计算机视觉库,提供丰富的图像处理和几何视觉算法。支持批量变换、自动微分和 GPU 加速,适用于图像变换、增强和 AI 驱动的图像处理。
wandb/wandb
AI 开发平台,用于训练和微调模型,管理从实验到生产的全流程。支持 Python,提供实验跟踪、可视化和数据版本控制。集成主流 ML 框架,支持云端或私有部署。
huggingface/text-generation-inference
用于部署和服务大型语言模型的工具包。支持高性能文本生成,具备生产就绪特性,如分布式追踪和指标。支持多种硬件和量化方法,包括 bitsandbytes、GPT-Q、AWQ 等。提供 API 兼容 OpenAI Chat Completion,并优化了推理性能。
megvii-basedetection/yolox
高性能无锚点 YOLO 目标检测器,超越 YOLOv3-v5。支持 MegEngine、ONNX、TensorRT、ncnn 和 OpenVINO 部署,提供 PyTorch 和 MegEngine 实现。
thu-ml/tianshou
基于 PyTorch 的优雅深度强化学习库,模块化设计,支持在线/离线 RL、多智能体及基于模型的算法,提供灵活且高性能的框架。
ymcui/chinese-bert-wwm
基于全词掩码技术的中文BERT预训练模型系列,包括BERT-wwm、BERT-wwm-ext、RoBERTa-wwm-ext等,使用中文维基百科训练,支持通过Transformers和PaddleHub快速加载。
mozilla/tts
基于深度学习的文本转语音库,支持多语言与多说话人。提供预训练模型、高效训练工具及多种声码器,适用于研究与产品部署。
autogluon/autogluon
由 AWS AI 开发,自动化机器学习任务,仅需 3 行代码即可在图像、文本、时序和表格数据上训练并部署高精度模型。
satellite-image-deep-learning/techniques
专注于卫星与航拍影像的深度学习技术库,涵盖分类、分割、检测、时序分析等核心任务,提供架构与算法概览。
bigscience-workshop/petals
分布式运行大型语言模型,类似 BitTorrent。在家用电脑或 Google Colab 上进行微调和推理,速度比卸载快 10 倍。支持 Llama 3.1、Mixtral、Falcon、BLOOM 等模型。
openmined/pysyft
在他人服务器上执行数据科学,无需查看或获取数据副本。支持 Python 代码及第三方库,可连接 Datasite 进行统计分析与机器学习。支持 Linux、macOS、Windows、Docker 和 Kubernetes。
espnet/espnet
基于 PyTorch 的端到端语音处理工具包,支持语音识别、合成、翻译、增强、说话人日志及口语理解。遵循 Kaldi 风格数据处理,提供丰富实验配方。
advimman/lama
基于傅里叶卷积的图像修复模型,支持高分辨率(~2k)大掩码填充,训练于 256x256 但泛化能力极强,可处理周期性结构等复杂场景。
open-mmlab/mmsegmentation
基于 PyTorch 的开源语义分割工具箱与基准,是 OpenMMLab 项目的一部分。提供丰富的算法实现、统一的配置系统和全面的基准测试,支持多种主干网络和数据集。
jadore801120/attention-is-all-you-need-pytorch
基于 PyTorch 的 Transformer 模型实现,采用自注意力机制,支持 WMT 机器翻译任务的训练与推理。
blinkdl/chatrwkv
基于 RWKV(100% RNN)的开源聊天模型,性能媲美 Transformer,速度更快且显存占用更低。支持多种推理策略与硬件加速,提供 Python 库与演示脚本。
zyddnys/manga-image-translator
一键翻译图片/漫画中的文字,支持日、中、英等多语言。具备图像修复与排版功能,可本地或在线使用。
arogozhnikov/einops
为 PyTorch、JAX、TensorFlow 等框架提供灵活强大的张量操作,提升代码可读性与可靠性。
pyannote/pyannote-audio
基于 PyTorch 的开源说话人日志工具包,提供语音活动检测、说话人变化检测、重叠语音检测和说话人嵌入等神经网络模块。支持社区版与高精度版,可本地运行或调用云端服务,性能领先。
voicepaw/so-vits-svc-fork
基于 so-vits-svc 的分支,提供实时语音转换功能,改进了用户界面并集成了更多特性。支持 Python 3.8+,可通过 pip 安装,无需额外依赖。
replicate/cog
开源工具,将机器学习模型打包为标准生产就绪容器。自动处理 Dockerfile、CUDA 兼容性、输入输出定义和 HTTP 服务器,支持部署到自建基础设施或 Replicate 平台。
vwxyzjn/cleanrl
提供高质量单文件实现的深度强化学习库,支持 PPO、DQN、C51 等算法。具备研究友好特性,如基准测试、Tensorboard 日志、实验管理与云集成,代码简洁易读,便于原型开发与调试。
roboflow/notebooks
提供 SOTA 计算机视觉模型教程,涵盖 ResNet、RF-DETR、YOLO11、SAM 3、Qwen3-VL 等,支持目标检测、分割、姿态估计等任务。
cadene/pretrained-models.pytorch
为 PyTorch 提供多种预训练卷积神经网络,包括 NASNet、ResNeXt、ResNet、InceptionV4 等,通过统一接口简化调用,支持迁移学习与研究复现。
xorbitsai/inference
通过单行代码切换任意LLM。支持云端、本地或笔记本部署开源、语音及多模态模型,提供统一的生产级推理API。
activeloopai/deeplake
专为 AI 设计的数据库,支持向量、图像、文本、视频等数据的存储与查询。与 LLMs/LangChain 集成,提供数据版本管理、可视化及实时流式传输至 PyTorch/TensorFlow。
pyro-ppl/pyro
基于 PyTorch 的灵活、可扩展的深度概率编程库,支持通用概率分布建模与推理,适用于大规模数据集。
intel/ipex-llm
加速本地大模型推理与微调,支持 Intel XPU(iGPU、NPU、Arc 等),无缝集成 llama.cpp、Ollama、HuggingFace 等框架,提供 70+ 模型优化与低比特支持。
mvig-sjtu/alphapose
实时高精度全身多人姿态估计与跟踪系统。支持COCO、MPII等数据集,提供PoseFlow在线跟踪器,性能领先。兼容Linux与Windows,提供Colab快速启动。
mitdeeplearning/introtodeeplearning
MIT 6.S191 深度学习入门课程的实验材料,包含所有代码和软件实验室。支持在 Google Colab 中直接运行,无需本地下载。提供 MIT 深度学习 Python 包,含便捷函数。