探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
基于 pdfminer.six 的 Python PDF 解析库,可提取文本、表格及每个字符、矩形、线条的详细信息,支持可视化调试。
基于 U-Net 和 Transformer 的混合频谱与波形源分离模型,支持鼓、贝斯、人声等多音轨分离。v4 版本引入混合 Transformer 架构,性能达 9.20 dB SDR,提供 4 音轨与实验性 6 音轨版本。
PyTorch3D 是 FAIR 开发的可重用组件库,专为 3D 数据的深度学习设计。核心功能包括三角形网格数据结构与高效操作、可微分渲染器,以及用于神经隐式表示的 Implicitron 框架。所有操作均基于 PyTorch 张量实现,支持异构小批量数据、自动微分和 GPU 加速。
为 Krita 提供生成式 AI 工作流。支持局部重绘、实时绘画、图像扩展与放大。集成 ControlNet、IP-Adapter 等模型,可本地运行,无需调整参数即可使用。
极简主义 Python ASGI/WSGI 框架,专注大规模微服务的可靠性、性能与正确性。无魔法设计,原生支持 asyncio,严格遵循 RFC,代码高度优化且无外部依赖。
超低延迟自托管实时语音转文本,支持说话人识别与多语言同步翻译。基于前沿研究,提供智能缓冲与增量处理,适用于多种场景。
基于视觉语言模型的开源多模态智能体,支持 GUI、游戏、代码和工具使用。通过强化学习实现高级推理,可在虚拟世界中执行多样化任务。提供桌面版与 Web 自动化方案。
实时全双工语音对话框架,基于 Mimi 流式神经音频编解码器。提供 PyTorch、MLX 和 Rust 三种推理栈,支持研究、本地与生产部署。
基于 DINO 的开放集目标检测模型,支持零样本检测。提供 PyTorch 实现与预训练模型,集成 Grounded SAM 2 用于开放世界跟踪。
纯 bash 脚本,用于测试并等待 TCP 主机和端口的可用性。无外部依赖,适用于同步启动相互依赖的服务,如 Docker 容器。支持超时设置和严格模式,可执行命令或仅检查状态。
低代码全栈 Web 框架,使用 Python 和 JavaScript 构建。提供内置管理界面、角色权限、REST API、可定制表单和报告生成器,适用于构建复杂的企业级应用。
基于单张图片实现高分辨率 3D 人体数字化,采用多层级像素对齐隐式函数,支持 PyTorch 实现与 Google Colab 在线演示。
基于 PyTorch 的端到端语音处理工具包,支持语音识别、合成、翻译、增强、说话人日志及口语理解。遵循 Kaldi 风格数据处理,提供丰富实验配方。
统一管理来自多个平台和模拟器的游戏,自动安装与配置。支持 Humble Bundle、GOG 和 Steam 库同步,提供脚本化安装与命令行工具。
一款以人为本的网页任务自动化研究原型,支持在执行前展示计划、引导操作并请求敏感操作批准。集成 Fara-7B 模型,支持文件上传、MCP 扩展和 Docker 快速部署,适用于监控、表单填写和数据分析等复杂任务。
开源音频、音乐与语音生成工具包,支持 TTS、VC、AC、SVC、TTA 等多种任务,提供经典模型可视化,助力可复现研究与初学者入门。
提供逻辑、标准化且灵活的数据科学项目结构,支持最佳实践。基于 Python,通过 ccds 命令快速生成项目模板,包含数据、模型、文档等标准目录。
基于AI的本地化工具,无损去除视频与图片中的硬字幕及文本水印。支持自定义位置或全画面自动处理,无需第三方API。提供预构建包与Docker镜像,兼容Windows/macOS/Linux。
纯 Python 实现的 SSHv2 协议库,提供客户端和服务器功能,是 Fabric 等高级库的基础。支持加密、远程命令执行和文件传输。
包含 Ansible 自动化工具的 DevOps 实践示例,涵盖多节点编排、角色、动态清单、CI/CD 及安全加固等场景,支持 Vagrant 与虚拟机环境。
类似按键精灵的鼠标键盘录制和自动化工具,支持 Windows、Linux、macOS。可录制并回放点击、键盘输入,设定执行次数,绿色免安装,Python 编写。
U²-Net 是一个用于显著目标检测的深度神经网络,采用嵌套 U 形结构,能更深入地提取特征。该模型在 Pattern Recognition 2020 发表并获最佳论文奖,支持多种应用,如背景移除、肖像生成和移动端部署。
功能强大的子域收集工具,基于 Python 3.6+ 开发,支持多种收集方式和 API 集成,提供命令行和 Docker 部署选项,结果以 CSV 和 SQLite 格式输出。
基于 PyTorch 的开源语义分割工具箱与基准,是 OpenMMLab 项目的一部分。提供丰富的算法实现、统一的配置系统和全面的基准测试,支持多种主干网络和数据集。
基于 PyTorch 的 Transformer 模型实现,采用自注意力机制,支持 WMT 机器翻译任务的训练与推理。