探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
基于视觉语言模型的开源多模态智能体,支持 GUI、游戏、代码和工具使用。通过强化学习实现高级推理,可在虚拟世界中执行多样化任务。提供桌面版与 Web 自动化方案。
类似按键精灵的鼠标键盘录制和自动化工具,支持 Windows、Linux、macOS。可录制并回放点击、键盘输入,设定执行次数,绿色免安装,Python 编写。
基于 DiT 的视频生成模型,支持同步音频视频、4K 高保真、多关键帧控制、图像到视频转换及视频扩展。提供在线演示、本地部署、ComfyUI 集成及训练工具。
分布式运行大型语言模型,类似 BitTorrent。在家用电脑或 Google Colab 上进行微调和推理,速度比卸载快 10 倍。支持 Llama 3.1、Mixtral、Falcon、BLOOM 等模型。
实时全双工语音对话框架,基于 Mimi 流式神经音频编解码器。提供 PyTorch、MLX 和 Rust 三种推理栈,支持研究、本地与生产部署。
以人为本的框架,帮助科学家和工程师构建和管理 AI/ML 系统。支持从笔记本快速原型到生产部署的全流程,具备实验跟踪、版本控制、可视化及云上弹性伸缩能力。由 Netflix 开发,现由 Outerbounds 支持。
汇聚各类电子书下载链接,涵盖帆书、微信读书、京东读书、喜马拉雅等平台。提供 epub、mobi、azw3 格式,支持 GitHub Pages 实时搜索与多关键词检索。
基于 DINO 的开放集目标检测模型,支持零样本检测。提供 PyTorch 实现与预训练模型,集成 Grounded SAM 2 用于开放世界跟踪。
Monocraft 是一款受 Minecraft 字体启发的等宽编程字体。它包含 1500 多个字形,优化了可读性与间距,支持编程连字和 Minecraft 附魔台语言。提供 Windows、Mac、Linux 安装方式,也支持网页使用。
为 Krita 提供生成式 AI 工作流。支持局部重绘、实时绘画、图像扩展与放大。集成 ControlNet、IP-Adapter 等模型,可本地运行,无需调整参数即可使用。
低代码全栈 Web 框架,使用 Python 和 JavaScript 构建。提供内置管理界面、角色权限、REST API、可定制表单和报告生成器,适用于构建复杂的企业级应用。
基于 U-Net 和 Transformer 的混合频谱与波形源分离模型,支持鼓、贝斯、人声等多音轨分离。v4 版本引入混合 Transformer 架构,性能达 9.20 dB SDR,提供 4 音轨与实验性 6 音轨版本。
Python 库,用于高效定义、优化和评估涉及多维数组的数学表达式。已停止开发,由 PyMC 开发者 fork 为 PyTensor 项目继续开发。
开源 cron 作业与后台任务监控服务,基于 Python & Django。支持 HTTP 请求和邮件“ping”,超时自动告警。提供 Web 仪表盘、API、25+ 集成、团队管理、WebAuthn 2FA 等功能。
30天系统学习 TensorFlow 2.0,包含 PyTorch 对比与 Keras 深度解析。提供可云端运行的 Jupyter Notebook 代码与数据集,适合工程师与研究者。
学术文档 PDF 解析工具,支持 LaTeX 数学公式和表格识别,可将 PDF 转换为 Markdown 格式。提供命令行和 API 接口,支持 GPU 加速。
基于 TensorFlow 2 的神经网络库,提供简单、可组合的抽象,用于机器学习研究。核心概念为 snt.Module,支持自定义模块,不捆绑训练框架。
基于 Python 的 Cursor Pro 自动化工具,支持自动注册与登录。提供在线文档与社区支持,遵循 CC BY-NC-ND 4.0 许可证。
统一管理来自多个平台和模拟器的游戏,自动安装与配置。支持 Humble Bundle、GOG 和 Steam 库同步,提供脚本化安装与命令行工具。
在任何 AI 基础设施上运行、管理和扩展 AI 工作负载。统一访问和管理所有 AI 计算资源(Kubernetes、20+ 云或本地)。提供简单接口,支持多云池、自动扩缩容和成本优化。
在他人服务器上执行数据科学,无需查看或获取数据副本。支持 Python 代码及第三方库,可连接 Datasite 进行统计分析与机器学习。支持 Linux、macOS、Windows、Docker 和 Kubernetes。
Python 3.8+ 库,用于集成 Ollama。支持本地与云端模型,提供同步/异步客户端、流式响应及完整 REST API 功能。
利用深度神经网络,将简笔画转化为精美艺术品,从照片生成无缝纹理,实现图像风格迁移与基于示例的图像放大。支持语义风格迁移,可处理多种输入图像。
PyTorch3D 是 FAIR 开发的可重用组件库,专为 3D 数据的深度学习设计。核心功能包括三角形网格数据结构与高效操作、可微分渲染器,以及用于神经隐式表示的 Implicitron 框架。所有操作均基于 PyTorch 张量实现,支持异构小批量数据、自动微分和 GPU 加速。