探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
构建弹性语言智能体的低级编排框架。支持持久化执行、人机回环、全面记忆和生产就绪部署。与 LangChain 生态无缝集成。
开源视觉语言多任务学习模型,提供 MiniGPT-4 和 MiniGPT-v2 代码。支持图像理解与对话,集成 Hugging Face 和 Gradio 演示,社区构建了多种应用。
从零开始构建智能体的系统教程,涵盖核心原理、经典范式、框架开发与 Agentic RL 训练,提供从理论到实战的完整学习路径。
自主深度研究代理,支持 Web 与本地数据,生成带引用的详细报告。基于 Plan-and-Solve 与 RAG 架构,通过并行化代理提升速度与可靠性。提供高度可定制化选项,适用于各类研究任务。
基于 Keras 和 TensorFlow 的 Mask R-CNN 实现,用于目标检测与实例分割。支持 MS COCO 预训练权重、多 GPU 训练及自定义数据集训练,提供可视化工具与逐步调试笔记本。
完全本地的自主 AI 助手,无需 API 和月费。支持网页浏览、代码编写与任务规划,所有数据保留在本地设备,确保隐私安全。适用于 Python 等多种语言。
FLUX.1 官方推理库,支持多种图像生成与编辑模型,包括文本到图像、图像修复、结构化条件生成等。提供 Python 安装与 TensorRT 支持,模型权重开放,可商用授权。
社区驱动的深度研究框架,结合语言模型与网络搜索、爬虫及 Python 执行工具,回馈开源社区。支持火山引擎 FaaS 一键部署与 InfoQuest 智能搜索工具。
开源 RAG 工具,用于与文档对话。支持多种 LLM 和本地模型,提供简洁 UI 与可定制框架。具备混合检索、多模态问答和高级引用功能。
SOTA 开源 TTS,支持自然、富有情感的语音克隆与合成。提供 4B 参数旗舰版与 0.5B 参数迷你版,均集成人类反馈强化学习。支持在线演示与本地部署。
Python 开发工作流管理工具,统一 pip、virtualenv 和 Python 解释器,支持多平台。自动生成虚拟环境和 Pipfile,提供确定性构建,通过 Pipfile.lock 确保依赖安全与一致性。
一款不可检测、强大、灵活且高性能的 Python 库,让网络爬取变得轻松高效。具备自适应能力,能自动适应网站结构变化,无需重写选择器。内置快速解析引擎和多种抓取器,支持反检测和动态内容。
PyTorch 实现的 CycleGAN 和 pix2pix,支持无配对和配对图像转换。2025 年更新支持 Python 3.11 和 PyTorch 2.4,新增 DDP 多 GPU 训练。推荐 img2img-turbo 和 CUT 以获得更快推理和更高效训练。
基于 Python 和 Qt 的图形化图像标注工具,支持 PASCAL VOC、YOLO 和 CreateML 格式。已不再积极开发,推荐使用其所属的 Label Studio 社区项目。
跨平台命令行工具,基于模板快速创建项目。支持 Python 包、C 项目等,无需 Python 知识。兼容 Windows、Mac、Linux,使用 Jinja2 模板引擎。
连接 LLM 与 ML 社区的系统,以 LLM 为控制器,集成 HuggingFace 专家模型执行复杂 AI 任务。支持任务规划、模型选择、执行与响应生成,提供轻量级配置与云端部署选项。
视觉指令微调框架,构建具备 GPT-4V 级别能力的多模态大语言模型。支持图像与视频理解,提供 LLaVA-NeXT 等最新模型,社区生态丰富,涵盖多种部署与评估工具。
基于 Python 的数据应用与仪表板框架,无需 JavaScript。内置 Plotly.js、React 和 Flask,支持下拉菜单、滑块等 UI 元素与 Python 分析代码直接绑定。提供丰富的图表类型与跨平台部署能力。
开源等宽字体,支持连字与 Nerd-Font 图标,提供无限字重与细粒度自定义选项。中英文宽度完美 2:1 对齐,适用于 IDE 与终端,支持简繁中文及日文字符集。
高性能大语言模型与多模态模型服务框架,支持 DeepSeek、LLaDA 等最新模型,提供 TPU 原生运行及大规模专家并行部署方案。
基于 Python 的命令行工具,从 Spotify 播放列表和歌曲中下载音乐,并从 YouTube 获取匹配的音频,同时嵌入专辑封面、歌词和元数据。支持多种安装方式,包括 pip、Docker 和预编译可执行文件。
开源手机智能代理模型与框架,通过视觉语言模型理解屏幕内容,结合 ADB 自动化操作,实现自然语言驱动的手机任务自动化。支持 Android 与 iOS 设备,提供远程调试能力,适用于研究与学习。
端侧多模态大模型,支持视觉、语音及全双工实时流式处理,性能媲美 Gemini 2.5 Flash。提供 4.5B 和 9B 参数版本,适用于手机等设备部署。
社区驱动的 GitHub Copilot 增强资源库,提供自定义指令、提示词和配置,涵盖代理、技能和集合,支持 MCP 服务器一键安装,提升编程效率。
minGPT 是 OpenAI GPT 的极简 PyTorch 重实现,专注于教育与可解释性。代码约 300 行,包含训练与推理,支持 GPT-2 模型加载与微调。