探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
开发者作品集灵感库,收录 1478 个作品集,按字母排序,支持随机跳转。由 Ali Spittel 的推文启发,欢迎贡献。
基于云原生栈构建多模态 AI 应用。支持 gRPC、HTTP 和 WebSocket 通信,提供高性能服务设计、LLM 流式输出、内置 Docker 集成与 Executor Hub,支持一键部署至 Jina AI Cloud 及 Kubernetes。
提供推荐系统最佳实践,包含经典与前沿算法示例。支持数据准备、模型构建、评估、优化及生产部署,适用于研究与开发。
小米官方支持的 Home Assistant 集成组件,支持多种小米 IoT 智能设备。提供 Git、HACS 及手动安装方式,支持多账户登录与调试模式,需注意配置文件安全。
Python爬虫从零到一教程,涵盖浏览器与APP抓包、Requests/Selenium/Appium/Scrapy等库、IP代理、验证码识别、数据库存储、多线程/多进程、JS逆向及分布式爬虫实战。
3D 高斯泼溅用于实时辐射场渲染的官方实现。基于 Python,支持高保真度、实时(≥30fps)的新视角合成,适用于无界场景。包含预训练模型、评估工具及 SIBR 实时查看器。
基于 LangChain 和 LangGraph 的智能体框架,提供规划工具、文件系统后端和子智能体生成功能,开箱即用,支持自定义工具和模型。
基于 Whisper 的高速语音识别工具,提供单词级时间戳和说话人识别。支持批量推理,速度达实时 70 倍,使用 wav2vec2 进行音素对齐,pyannote-audio 进行说话人分离。
🤗 Datasets 是一个轻量级库,提供两大核心功能:一键加载众多公共数据集,以及高效的数据预处理。支持内存映射、智能缓存和流式模式,可与 NumPy、PyTorch、TensorFlow 等框架无缝集成。
轻量级多智能体编排框架,专注于协调与执行。通过 Agent 和 handoff 抽象,实现可扩展的实时解决方案。已由 OpenAI Agents SDK 取代,适用于教育探索。
使用 LLM 和计算机视觉自动化浏览器工作流,提供简单 API 端点,替代脆弱的自动化方案。基于视觉理解,无需定制代码即可适应新网站,抗布局变化,支持复杂推理。
基于 Python 的检索插件,通过自然语言查询实现个人或工作文档的语义搜索。支持多种向量数据库,可作为独立后端与 ChatGPT 自定义 GPT、函数调用或助手 API 集成。
开源机器学习框架,用于自动化文本和语音对话:NLU、对话管理,支持 Slack、Facebook 等平台,构建聊天机器人和语音助手。目前进入维护模式,未来聚焦于 Hello Rasa 和 CALM。
领先的开源数据集成平台,支持从 API、数据库和文件到数据仓库、数据湖和湖仓的 ETL/ELT 管道。提供 600+ 连接器,支持自托管和云托管,可通过无代码构建器或低代码 SDK 快速创建连接器。
开源身份提供商,支持 SAML、OAuth2/OIDC、LDAP、RADIUS 等协议,适用于自托管场景,从实验室到生产集群。
通义千问官方仓库,提供 Qwen 系列大语言模型,包括 1.8B、7B、14B、72B 参数的基座与对话模型。支持 Hugging Face、ModelScope、Demo 及 API,已开源。
⚡️ 轻量级高效 AI 证件照工具,支持离线抠图、多尺寸生成与美颜。基于 Python,提供 Gradio Demo、API 服务与 Docker 部署。
收录 300+ 免费 ChatGPT 镜像网站,持续更新。提供 GPT-4、Claude 等模型支持,包含公益站点与开发者工具。⚠️ 注意:请勿输入敏感信息。
🤗 PEFT:最先进的参数高效微调库。仅微调少量参数,即可高效适配大模型至下游任务,显著降低计算与存储成本。与 Transformers、Diffusers 和 Accelerate 深度集成,支持 LoRA 等多种方法。
由字节跳动 Seed 团队发起的 RL 训练库,支持灵活扩展多种 RL 算法,无缝集成现有 LLM 框架,具备高效资源利用和 SOTA 吞吐量。
开源企业级智能体平台,支持 RAG 管道、工作流编排和 MCP 工具调用。提供多模态输入输出,兼容各类大模型,可快速集成至第三方系统。
AI 驱动的个性化学习助手。支持海量文档知识问答与交互式学习可视化。具备知识强化、深度研究与创意生成功能。采用 Python、FastAPI、React 与 Next.js 构建。
开放神经网络交换标准,为 AI 模型提供开源格式,支持深度学习和传统机器学习。定义可扩展的计算图模型、内置算子和标准数据类型,专注于推理能力。广泛支持多种框架、工具和硬件,促进 AI 社区创新。
基于大语言模型的多语种语音生成系统,支持零样本克隆与流式推理。覆盖9种语言及18+中方言,提供发音修复、文本归一化与指令控制。性能领先,延迟低至150ms,适用于生产环境。
一个用于 Python 的反应式笔记本,可运行可复现实验、用 SQL 查询、作为脚本执行、作为应用部署,并使用 git 进行版本控制。存储为纯 Python 文件,配备现代化、AI 原生的编辑器。
基于 Django 的开源 CMS,专注于用户体验与灵活性。提供快速界面、完整前端控制、可扩展至百万页面。支持 StreamField、多站点、多语言及内容 API,适用于各类规模项目。