探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
基于 Python 的命令行工具,从 Spotify 播放列表和歌曲中下载音乐,并从 YouTube 获取匹配的音频,同时嵌入专辑封面、歌词和元数据。支持多种安装方式,包括 pip、Docker 和预编译可执行文件。
Python 开发工作流管理工具,统一 pip、virtualenv 和 Python 解释器,支持多平台。自动生成虚拟环境和 Pipfile,提供确定性构建,通过 Pipfile.lock 确保依赖安全与一致性。
Chatterbox 是 Resemble AI 推出的系列开源 TTS 模型,包含三个版本。Turbo 版本采用 350M 参数架构,计算和显存需求更低,支持 `[cough]` 等副语言标签,延迟低于 200ms,适用于低延迟语音代理和创意工作流。
基于深度神经网络的 GUI 人声移除工具,支持 Windows 和 macOS,提供多种先进模型,可分离音轨。
基于 Python 和 Qt 的图形化图像标注工具,支持 PASCAL VOC、YOLO 和 CreateML 格式。已不再积极开发,推荐使用其所属的 Label Studio 社区项目。
跨平台命令行工具,基于模板快速创建项目。支持 Python 包、C 项目等,无需 Python 知识。兼容 Windows、Mac、Linux,使用 Jinja2 模板引擎。
视觉指令微调框架,构建具备 GPT-4V 级别能力的多模态大语言模型。支持图像与视频理解,提供 LLaVA-NeXT 等最新模型,社区生态丰富,涵盖多种部署与评估工具。
🤗 LeRobot:通过端到端学习降低机器人 AI 门槛。提供 PyTorch 模型、数据集与工具,支持硬件无关的统一控制接口,涵盖低成本机械臂到人形机器人。拥有标准化 LeRobotDataset 格式(Parquet + MP4/图像),可在 Hugging Face Hub 高效存储与流式访问。提供可迁移至真实世界的 SOTA 策略,支持模仿学习、强化学习与视觉-语言-动作模型。
连接 LLM 与 ML 社区的系统,以 LLM 为控制器,集成 HuggingFace 专家模型执行复杂 AI 任务。支持任务规划、模型选择、执行与响应生成,提供轻量级配置与云端部署选项。
机器学习系统工程教材,涵盖从理论到部署的完整学习栈。提供在线阅读、PDF/EPUB 下载、TinyTorch 框架及硬件套件,支持在 Arduino、Raspberry Pi 等边缘设备上实践。包含 17k+ 星标的开源项目,由哈佛大学团队维护。
AI 驱动的个性化学习助手。支持海量文档知识问答与交互式学习可视化。具备知识强化、深度研究与创意生成功能。采用 Python、FastAPI、React 与 Next.js 构建。
minGPT 是 OpenAI GPT 的极简 PyTorch 重实现,专注于教育与可解释性。代码约 300 行,包含训练与推理,支持 GPT-2 模型加载与微调。
基于 LangChain 和 LangGraph 的智能体框架,提供规划工具、文件系统后端和子智能体生成功能,开箱即用,支持自定义工具和模型。
基于 Python 的数据应用与仪表板框架,无需 JavaScript。内置 Plotly.js、React 和 Flask,支持下拉菜单、滑块等 UI 元素与 Python 分析代码直接绑定。提供丰富的图表类型与跨平台部署能力。
Python 库,通过 Yahoo! Finance API 下载市场数据。支持单个/多个股票代码、实时流数据、搜索查询及行业板块信息。提供简洁的 Pythonic 接口,适用于研究与教育。
开发者作品集灵感库,收录 1478 个作品集,按字母排序,支持随机跳转。由 Ali Spittel 的推文启发,欢迎贡献。
FlashAttention 是一种快速且内存高效的精确注意力实现,支持 FlashAttention、FlashAttention-2 和 FlashAttention-3。它针对 Hopper GPU (如 H100) 进行了优化,支持 FP16/BF16/FP8 数据类型,适用于 NVIDIA CUDA 和 AMD ROCm 平台。
Python 日志库,开箱即用,无需样板代码。提供单个 logger 实例,支持文件轮转、压缩、异步、线程安全及彩色输出。兼容标准 logging,功能强大且使用简单。
基于 PyTorch 的图神经网络库,提供易用统一的 API、多种 SOTA GNN 模型、大规模图处理能力,支持多 GPU 和 torch.compile。
基于 2T tokens 从零训练的代码语言模型系列,支持 1B 至 33B 多种规模。提供 16K 上下文窗口和填空任务,支持项目级代码补全与填充。在 HumanEval、MBPP 等多项基准测试中性能领先,支持 100+ 编程语言。
蒸馏任何人的思维方式——心智模型、决策启发式、表达DNA。输入名字,自动完成调研、提炼、验证。支持乔布斯、马斯克、芒格等13位人物Skill,一键安装调用。
将自然语言问题转化为 SQL 查询并获取数据洞察。支持用户权限感知、流式响应、企业级安全与可嵌入的 Web 组件。兼容多种 LLM 与数据库,提供生产就绪的 FastAPI 集成。
基于 LLM 和 RAG 的 Python 库,支持通过自然语言与 SQL、CSV、Parquet 等数据库或数据湖对话,实现对话式数据分析。
基于 CTranslate2 的 Whisper 转录实现,速度提升 4 倍,内存占用更低,支持 CPU/GPU 8 位量化。
Python 编写的爬虫代理 IP 池,自动采集并验证免费代理,提供 API 和 CLI 接口。支持多种 Python 版本,可通过 Docker 部署,并允许扩展代理源以提升 IP 质量与数量。
收录中文独立博客的列表,按 RSS 订阅量排序,支持通过 Telegram 群组讨论优化组织方式。