探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
使用程序化生成创建无限逼真世界。支持室内、自然与关节化场景,提供高质量渲染与仿真数据。基于 Python,包含详细文档与学术论文引用。
基于 PyTorch 的高分辨率图像到图像翻译实现,支持 2048x1024 分辨率。使用条件 GAN 将语义标签图合成逼真图像,或从人脸标签生成肖像。提供交互式编辑功能。
基于 Gradio 的 AI 语音处理 WebUI,支持 YouTube 视频下载、Whisper 语音识别、Edge-TTS 与 kokoro 文本转语音,以及 E2/F5-TTS 和 CosyVoice 的零样本语音克隆。提供多语言翻译与人声分离功能,是创作者与开发者的全能工具。
基于 MITRE ATT&CK 框架的自动化对手模拟平台,用于红队演练和事件响应。核心系统提供异步 C2 服务器、REST API 和 Web 界面,支持通过插件扩展功能。
StyleGAN3 是 StyleGAN2 的官方 PyTorch 实现,核心是无别名生成对抗网络。它通过改进信号处理,解决了生成细节与图像坐标粘连的问题,实现了平移和旋转的完全等变性。该版本兼容旧模型,支持多种训练配置,并提供了可视化和视频生成工具。
RSA 攻击工具,主要用于 CTF。从弱公钥恢复私钥或解密数据。集成多种整数分解算法,支持 Wiener、Hastad、Boneh-Durfee 等攻击方法。
基于 Flask 的轻量级框架,用于快速构建 RESTful API。提供资源路由、请求解析、响应格式化等核心组件,简化 API 开发流程。
开源库存管理系统,基于 Python/Django 构建,提供强大的低级库存控制和部件追踪。支持 REST API 和插件系统,易于扩展和集成。
超过 230 个 BSD 许可的纯 Python 工具集,扩展标准库功能。提供原子文件保存、优化有序字典、多种优先队列、分块迭代、递归数据结构操作及回溯信息等实用构造。
基于 Stable Diffusion 的 PyTorch 实现,通过文本指令编辑图像。支持命令行和 Gradio 交互界面,提供预训练模型和生成数据集。
基于 Django 的 SQL 审核查询平台,支持 MySQL、Oracle、Redis 等多种数据库,提供查询、审核、执行、备份及数据字典等功能。
一个全面的 WSGI Web 应用库,提供交互式调试器、请求/响应对象、路由系统和 HTTP 工具。支持本地开发服务器和测试客户端,无强制依赖,可构建各类应用。
NVIDIA Isaac GR00T N1.6 是一个开源视觉-语言-动作模型,用于通用人形机器人技能。它支持多模态输入,可适应不同形态、任务和环境,并提供预训练、微调和推理工具。
基于 Apple MLX 框架的音频处理库,为 Apple Silicon 提供高效的文本转语音、语音转文本和语音转语音功能。支持多种模型架构、多语言、语音克隆和量化优化,提供命令行工具、Python API 和 Web 界面。
OCR-free 文档理解 Transformer,无需 OCR 引擎即可处理视觉文档分类与信息提取任务。提供 SynthDoG 合成文档生成器,支持多语言与领域预训练。
通过小米 AI 音箱使用 ChatGPT 及其他大语言模型。支持多种 AI 类型,如 ChatGPT、New Bing、ChatGLM、Gemini 等。提供命令行工具,可配置 API 密钥,实现语音交互与 TTS 回答。
跨平台应用,使用 mpv 作为 DLNA 媒体渲染器。可从手机推送视频、图片或音乐到电脑。支持 macOS、Windows 和 Linux。
基于 Python 的流处理库,将 Kafka Streams 理念移植到 Python。支持异步、静态类型和分布式状态管理,适用于实时数据管道和高吞吐量事件处理。
本地化数据摄取与解析平台,支持文档、多媒体及网页等约 20 种格式,转换为高质量结构化 Markdown,优化 GenAI 兼容性。完全离线运行,适配 T4 GPU,支持 Docker 部署与 Gradio 交互界面。
自动清理 LaTeX 代码,移除注释、辅助文件和未使用资源,优化大小以适应 arXiv 50MB 限制。支持图像压缩、PDF 压缩和 TikZ 图片源码隐藏,通过配置文件实现高级正则替换。