探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
开源视频翻译与配音工具,支持自动语音识别、字幕翻译、多角色 AI 配音及音画同步。集成多种主流 API 与本地模型,提供 GUI 与 CLI 操作,适用于 Windows、macOS 和 Linux。
基于 Core ML 在 Apple Silicon 上运行 Stable Diffusion。提供 Python 包将 PyTorch 模型转换为 Core ML 格式,并使用 Swift 包在 Xcode 项目中部署图像生成能力。支持 macOS、iPadOS 和 iOS 设备,性能经过优化。
AUTOMATIC1111 的 WebUI 扩展,为 Stable Diffusion 添加 ControlNet 支持。无需模型合并,实时注入控制。支持 ControlNet 1.1、T2I Adapter 及多种预处理器,集成高分辨率修复与像素完美模式。
为 AI Agent 提供持久化记忆,6 行代码即可实现。通过 ECL 管道将原始数据转化为动态记忆,结合向量搜索与图数据库,实现语义检索与关系连接。支持 30+ 数据源,可高度定制。
提供 192 个生产就绪的 Claude Code 技能与插件,支持 11 种 AI 编码工具,涵盖工程、营销、产品等多领域,Python 编写,零依赖安装。
端到端语音识别工具包,支持 ASR、VAD、标点恢复、说话人验证等。提供工业级预训练模型,支持推理与微调,涵盖 Paraformer、Whisper 等模型。
提供 Michael Nielsen 所著《神经网络与深度学习》一书的 Python 代码示例。代码基于 Python 2.6/2.7,包含 Theano 库的使用。项目采用 MIT 许可证,欢迎贡献。
基于 Pydantic 的 GenAI Agent 框架,提供类型安全、模型无关、无缝可观测性和强大的评估功能。支持 MCP、A2A 和 UI 标准,实现人机回圈工具审批和持久化执行。
基于 Python 的工具,利用 OpenCore 和 Lilu,让旧款 Mac 安装并运行 macOS Big Sur 及更新系统。支持原生 OTA 更新、WPA Wi-Fi、系统完整性保护等功能,无需固件修补。
开源自主 AI 代理框架,专为开发者设计。支持快速构建、管理和运行实用的自主代理。基于 Python,拥有超过 1.7 万星标。
提供预构建的 Windows Subsystem for Android 二进制文件,支持 Google Play 商店和 Magisk/KernelSU root 方案,适用于 Windows 10 和 11。
PyTorch GAN 实现集合,涵盖多种生成对抗网络模型,如 ACGAN、AAE、BEGAN 等。项目已停止维护,但代码完整,支持 Python 环境,星标数 17426。
基于 Python 的开源量化交易系统,支持股票、期权、期货、比特币及机器学习。提供完整架构、教程与非编程界面,覆盖全球主要市场,附带实时 AI 研报与多种技术分析模型。
将 PDF 等图像文档线性化为纯文本,支持公式、表格和手写体识别。基于 7B 参数 VLM,成本低于 200 美元/百万页,需 GPU。
个人 AI 助手,易安装、可本地或云端部署。支持多聊天应用,扩展性强。内置定时任务,自定义技能,内存可控。适用于社交、生产力、创意、研究和桌面场景。
一键生成 Netflix 级字幕,支持字幕切割、翻译、对齐及 AI 配音。基于 WhisperX 实现低幻觉识别,NLP 驱动分段,提供单行字幕与高质量配音,支持 YouTube 视频下载与多语言 UI。
可扩展的生成式 AI 框架,专为大语言模型、多模态和语音 AI 研究人员与开发者打造。支持 Python,提供 ASR 和 TTS 功能。
TensorFlow 官方深度学习库,提供丰富的模型和数据集,旨在降低深度学习门槛并加速机器学习研究。支持多种任务如翻译、图像分类和文本生成,现已推荐使用其后继库 Trax。
零代码变更即可优化 AI 智能体,支持任何框架(如 LangChain、AutoGen)。通过强化学习、自动提示优化等算法,选择性优化多智能体系统中的一个或多个智能体。
专注于大模型异构推理与微调的高效框架,支持 CPU-GPU 协同计算。核心模块 kt-kernel 提供高性能内核,支持 AMX/AVX 加速与 MoE 优化;kt-sft 集成 LLaMA-Factory,支持 RL-DPO 等微调。已支持 Kimi-K2、DeepSeek-V3/R1、Qwen3-Next 等模型,提供 Day0 支持与多硬件适配。
基于 AI 的快速精准文件类型检测工具,支持 200+ 内容类型,准确率约 99%。提供 CLI、Python API 及多语言绑定,推理时间约 5ms/文件,适用于大规模安全扫描。
亚马逊 Web 服务的统一命令行界面,基于 Python 开发。支持多版本 Python,提供安装与配置指南。当前 v1 版本已进入维护模式,建议迁移至 v2。