探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
🤗 LeRobot:通过端到端学习降低机器人 AI 门槛。提供 PyTorch 模型、数据集与工具,支持硬件无关的统一控制接口,涵盖低成本机械臂到人形机器人。拥有标准化 LeRobotDataset 格式(Parquet + MP4/图像),可在 Hugging Face Hub 高效存储与流式访问。提供可迁移至真实世界的 SOTA 策略,支持模仿学习、强化学习与视觉-语言-动作模型。
大规模跨任务、语言和模态的自监督预训练框架。涵盖语言、视觉、语音及多模态模型,如 UniLM、BEiT、WavLM 和 Kosmos 系列。包含基础架构研究,如 BitNet、RetNet、LongNet 等新型 Transformer 架构。
Python SDK 实现 Model Context Protocol,支持构建 MCP 客户端与服务器,提供 stdio、SSE 和 Streamable HTTP 传输,处理协议消息与生命周期事件。
Python 库,通过 Yahoo! Finance API 下载市场数据。支持单个/多个股票代码、实时流数据、搜索查询及行业板块信息。提供简洁的 Pythonic 接口,适用于研究与教育。
基于云原生栈构建多模态 AI 应用。支持 gRPC、HTTP 和 WebSocket 通信,提供高性能服务设计、LLM 流式输出、内置 Docker 集成与 Executor Hub,支持一键部署至 Jina AI Cloud 及 Kubernetes。
Python 工作流编排框架,用于构建弹性数据管道。支持调度、缓存、重试和事件驱动自动化,可自托管或使用 Prefect Cloud 监控。
小米官方支持的 Home Assistant 集成组件,支持多种小米 IoT 智能设备。提供 Git、HACS 及手动安装方式,支持多账户登录与调试模式,需注意配置文件安全。
提供推荐系统最佳实践,包含经典与前沿算法示例。支持数据准备、模型构建、评估、优化及生产部署,适用于研究与开发。
构建具有高级记忆的有状态 AI 代理平台,支持本地运行和 API 集成。提供 CLI 工具与 Python/TypeScript SDK,实现 AI 的持续学习与自我改进。
Python爬虫从零到一教程,涵盖浏览器与APP抓包、Requests/Selenium/Appium/Scrapy等库、IP代理、验证码识别、数据库存储、多线程/多进程、JS逆向及分布式爬虫实战。
基于 CTranslate2 的 Whisper 转录实现,速度提升 4 倍,内存占用更低,支持 CPU/GPU 8 位量化。
🤗 Datasets 是一个轻量级库,提供两大核心功能:一键加载众多公共数据集,以及高效的数据预处理。支持内存映射、智能缓存和流式模式,可与 NumPy、PyTorch、TensorFlow 等框架无缝集成。
基于 Python 的检索插件,通过自然语言查询实现个人或工作文档的语义搜索。支持多种向量数据库,可作为独立后端与 ChatGPT 自定义 GPT、函数调用或助手 API 集成。
基于 Python 的配置框架,通过 30 个斜杠命令、16 个智能体和 7 种模式,将 Claude Code 转化为结构化开发平台。提供认知角色、开发方法论和系统化工作流自动化,支持从构思到部署的完整生命周期。
⚡ 自动解密未知密钥或密码的加密内容,解码编码,破解哈希值 ⚡ 基于 Python,使用自然语言处理与人工智能,无需了解密码学即可快速完成任务。
713+ 个经过实战检验的 AI 代理技能,适用于 Claude Code、Cursor、Gemini CLI 等主流 AI 编码助手。包含来自 Anthropic、Vercel 等官方技能,可将 AI 助手转化为全栈数字代理。
强大的编码代理工具包,提供语义检索与编辑能力。支持 MCP 服务器等多种集成方式,可将 LLM 转变为直接在代码库上工作的全功能代理。免费开源,无需绑定特定 LLM 或框架。
轻量级多智能体编排框架,专注于协调与执行。通过 Agent 和 handoff 抽象,实现可扩展的实时解决方案。已由 OpenAI Agents SDK 取代,适用于教育探索。
开源机器学习框架,用于自动化文本和语音对话:NLU、对话管理,支持 Slack、Facebook 等平台,构建聊天机器人和语音助手。目前进入维护模式,未来聚焦于 Hello Rasa 和 CALM。
开发者作品集灵感库,收录 1478 个作品集,按字母排序,支持随机跳转。由 Ali Spittel 的推文启发,欢迎贡献。
收录 300+ 免费 ChatGPT 镜像网站,持续更新。提供 GPT-4、Claude 等模型支持,包含公益站点与开发者工具。⚠️ 注意:请勿输入敏感信息。
3D 高斯泼溅用于实时辐射场渲染的官方实现。基于 Python,支持高保真度、实时(≥30fps)的新视角合成,适用于无界场景。包含预训练模型、评估工具及 SIBR 实时查看器。
领先的开源数据集成平台,支持从 API、数据库和文件到数据仓库、数据湖和湖仓的 ETL/ELT 管道。提供 600+ 连接器,支持自托管和云托管,可通过无代码构建器或低代码 SDK 快速创建连接器。
⚡️ 轻量级高效 AI 证件照工具,支持离线抠图、多尺寸生成与美颜。基于 Python,提供 Gradio Demo、API 服务与 Docker 部署。
开源 AI 黑客工具,自动发现并修复应用漏洞。支持 CI/CD 集成,提供真实 PoC 验证,配备完整黑客工具包,团队协作代理,开发者友好 CLI。
🤗 PEFT:最先进的参数高效微调库。仅微调少量参数,即可高效适配大模型至下游任务,显著降低计算与存储成本。与 Transformers、Diffusers 和 Accelerate 深度集成,支持 LoRA 等多种方法。
使用 LLM 和计算机视觉自动化浏览器工作流,提供简单 API 端点,替代脆弱的自动化方案。基于视觉理解,无需定制代码即可适应新网站,抗布局变化,支持复杂推理。