探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
基于 nano banana pro🍌 的原生 AI PPT 生成应用,支持上传任意模板与素材,通过一句话/大纲/页面描述自动生成 PPT,并能通过口头指令进行局部修改,一键导出可编辑的 PPTX/PDF,实现真正的“Vibe PPT”。
将任何 GitHub URL 中的 hub 替换为 ingest,即可获得代码库的 LLM 友好文本摘要。支持 CLI 工具和 Python 包,提供文件结构、大小和词元统计。
统一框架,支持 300+ 模型与 RAG 管道,优化本地、私有、安全的企业级应用。支持 GGUF、OpenVINO 等多种推理技术,提供模型目录与知识库管理,可在 AI PC 和边缘设备运行。
基于 Python 的状态行插件,为 vim、zsh、bash、tmux 等应用提供状态行和提示符。支持 JSON 配置与配色方案,轻量高效,具备守护进程模式。
Playwright Python 是一个自动化库,支持 Chromium、Firefox 和 WebKit 浏览器。提供同步和异步 API,跨平台运行,快速可靠。
基于 Python 的开源数据采集与下载工具,支持抖音/TikTok 发布、喜欢、合集、直播、视频、图集、音乐等多类型内容批量下载。提供 Web UI 与 API 接口,支持多线程、代理、断点续传及数据持久化。
开源替代方案,本地部署 GitHub Copilot 服务器。基于 SalesForce CodeGen 模型,集成 NVIDIA Triton 推理服务器与 FasterTransformer 后端。支持多 GPU 分布式推理,提供 Docker 部署与客户端配置。
基于流匹配的快速语音合成模型,支持 E2 TTS 与 F5-TTS。采用扩散 Transformer 和 ConvNeXt V2,训练与推理速度更快。提供 Sway Sampling 采样策略,显著提升性能。支持 NVIDIA、AMD、Intel GPU 及 Apple Silicon,可通过 pip 或 Docker 部署。
Llama中文社区,实时汇总最新Llama学习资料,构建最好的中文Llama大模型开源生态,完全开源可商用。提供模型、算力、数据、论坛等资源,支持Llama2、Llama3、Llama4全系列,涵盖预训练、微调、量化、部署等全流程。
分布式深度学习训练框架,支持 TensorFlow、Keras、PyTorch 和 Apache MXNet。基于 MPI 模型,易于扩展,性能高效,可实现单 GPU 到多 GPU、多节点的无缝迁移。
Python 视频编辑库,支持剪辑、拼接、标题插入、视频合成与处理。可读写常见音视频格式,包括 GIF,兼容 Windows/Mac/Linux,需 Python 3.9+。
Python 实现 Sutton & Barto 的《强化学习导论》第二版。包含各章节核心算法与示例代码,如多臂老虎机、动态规划、蒙特卡洛、Sarsa、Q-learning、Dyna-Q 等。
基于 Llama 架构的对话语音生成模型,支持文本与音频输入生成 RVQ 音频代码。提供 Hugging Face 集成与交互式语音演示。
开源实现 AlphaFold 2 推理管道,支持单体与多聚体预测。提供完整遗传数据库与模型参数,需 Linux 环境与 NVIDIA GPU。包含 CASP15 基线预测与技术说明。
基于 WebAssembly 的 Python 发行版,可在浏览器和 Node.js 中运行。支持通过 micropip 安装 PyPI 上的纯 Python 包及许多含 C/C++/Rust 扩展的科学计算包。提供强大的 JavaScript 与 Python 互操作接口。
NLTK 是一个开源 Python 工具包,提供自然语言处理模块、数据集和教程,支持 NLP 研究与开发。要求 Python 3.10 至 3.14。
基于 CDP 的自愈式浏览器操控框架,赋予 LLM 完成任意浏览器任务的完全自由。无需框架,直接连接 Chrome,支持动态编写缺失功能。
基于 Python 的流氓接入点框架,用于红队演练或 Wi-Fi 安全测试。通过执行定向 Wi-Fi 关联攻击(如 Evil Twin、KARMA、Known Beacons),可轻松获得无线客户端的中间人位置,并支持定制化网络钓鱼攻击以捕获凭证或传播恶意软件。功能强大、灵活且模块化,可在 Raspberry Pi 上长时间运行。
RWKV 是一种并行化 RNN,具备 Transformer 级别的 LLM 性能。RWKV-7 是线性时间、常数空间、无注意力的 RNN 架构,适用于 LLM 和多模态应用。支持高效推理和快速训练,社区资源丰富。
免费开源的机器翻译 API,完全自托管且离线可用。基于开源 Argos Translate 引擎,无需依赖 Google 或 Azure 等专有服务。
基于机器学习的对话引擎,使用 Python 构建。支持多语言训练,通过已知对话数据生成响应,语言无关设计使其能适应任何语言。
支持600+文本大模型与300+多模态大模型的微调与部署框架,集成PEFT/全参训练、DPO/GRPO等对齐算法,提供从训练到推理、评估、量化的全栈能力。
开源替代 NotebookLM、Perplexity 和 Glean。将任何 LLM 连接到内部知识源,与团队实时协作聊天。支持 50+ 文件格式、强大搜索、引用答案、本地 LLM、自托管、团队 RBAC、播客生成、深度代理架构和高级 RAG 技术。
StyleGAN 是 NVIDIA 开发的官方 TensorFlow 实现,用于生成对抗网络。它基于风格迁移,能自动分离图像的高级属性与随机变化,实现直观的尺度控制,生成高质量人脸图像。
开源 AI 工具箱,提供 Prompts 和 Skills。Prompts 轻量即用,Skills 遵循 Agent 标准,支持自动加载。核心功能包括横纵分析法与公众号长文写作。