探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
🤗 LeRobot:通过端到端学习降低机器人 AI 门槛。提供 PyTorch 模型、数据集与工具,支持硬件无关的统一控制接口,涵盖低成本机械臂到人形机器人。拥有标准化 LeRobotDataset 格式(Parquet + MP4/图像),可在 Hugging Face Hub 高效存储与流式访问。提供可迁移至真实世界的 SOTA 策略,支持模仿学习、强化学习与视觉-语言-动作模型。
基于 AI 的 Python 网页抓取库,利用 LLM 和图逻辑构建抓取管道,只需指定要提取的信息即可自动完成。
Python 编写的爬虫代理 IP 池,自动采集并验证免费代理,提供 API 和 CLI 接口。支持多种 Python 版本,可通过 Docker 部署,并允许扩展代理源以提升 IP 质量与数量。
将自然语言问题转化为 SQL 查询并获取数据洞察。支持用户权限感知、流式响应、企业级安全与可嵌入的 Web 组件。兼容多种 LLM 与数据库,提供生产就绪的 FastAPI 集成。
AI agent 技能,跨 Reddit、X、YouTube、Hacker News、Polymarket 及全网研究任何主题,合成基于事实的摘要。支持 Bluesky、对比模式、多源质量评分,自动保存文档,2-8 分钟完成深度调研。
强大的编码代理工具包,提供语义检索与编辑能力。支持 MCP 服务器等多种集成方式,可将 LLM 转变为直接在代码库上工作的全功能代理。免费开源,无需绑定特定 LLM 或框架。
收录中文独立博客的列表,按 RSS 订阅量排序,支持通过 Telegram 群组讨论优化组织方式。
包含50个数据结构与算法代码实现,涵盖数组、链表、栈、队列、递归、排序、二分查找、散列表、字符串、二叉树、堆、图、回溯、分治、动态规划等核心主题,使用Python编写。
Python 库,通过 Yahoo! Finance API 下载市场数据。支持单个/多个股票代码、实时流数据、搜索查询及行业板块信息。提供简洁的 Pythonic 接口,适用于研究与教育。
基于 2T tokens 从零训练的代码语言模型系列,支持 1B 至 33B 多种规模。提供 16K 上下文窗口和填空任务,支持项目级代码补全与填充。在 HumanEval、MBPP 等多项基准测试中性能领先,支持 100+ 编程语言。
免费开源的 AI 图像修复与扩展工具,基于 SOTA 模型。可移除图片中任意物体、缺陷或人物,支持擦除、替换、绘制文本及外扩生成。提供 Windows 一键安装,支持 CPU/GPU/Apple Silicon,内置多种模型与插件。
《设计数据密集型应用》DDIA 第二版中文翻译项目,由冯若航(Vonng)翻译,提供在线阅读与本地构建。涵盖数据系统基础、分布式数据与派生数据三大核心章节,旨在帮助架构师与工程师深入理解数据系统设计精髓。
基于 LLM 的视觉-文本压缩 OCR 模型,支持图像与 PDF 高效处理,集成 vLLM 推理,提供流式输出与批量评估。
Python 绘图库,支持静态、动画及交互式可视化,生成出版级图表,适用于脚本、Shell、Web 服务及 GUI 工具包。
Python SDK 实现 Model Context Protocol,支持构建 MCP 客户端与服务器,提供 stdio、SSE 和 Streamable HTTP 传输,处理协议消息与生命周期事件。
开源 AI Agent 上下文数据库,采用文件系统范式统一管理记忆、资源与技能,支持分层加载、递归检索与自演化,提升检索效果与可观测性。
Rembg 是一个移除图像背景的工具,支持 CLI、Python 库、HTTP 服务器和 Docker 容器。基于 Python 开发,拥有超过 2 万星标,提供 CPU、NVIDIA GPU 和 AMD ROCm 等多种后端安装选项。
轻量级 Python 人脸识别与面部属性分析库,集成 VGG-Face、FaceNet 等先进模型,支持年龄、性别、情绪和种族检测,提供完整的识别流程。
安全地在两台计算机间传输任意大小的文件或目录。使用简短、可发音的虫洞代码进行端点识别,无需记忆。支持 Python 3.10+,提供命令行工具和库。
通用大语言模型部署引擎,基于 ML 编译技术。支持 AMD、NVIDIA、Apple、Intel 等多平台 GPU,以及 Web、iOS、Android 等环境。提供 OpenAI 兼容 API,通过统一高性能引擎实现跨平台原生部署与优化。
基于 Python 的配置框架,通过 30 个斜杠命令、16 个智能体和 7 种模式,将 Claude Code 转化为结构化开发平台。提供认知角色、开发方法论和系统化工作流自动化,支持从构思到部署的完整生命周期。
基于 CTranslate2 的 Whisper 转录实现,速度提升 4 倍,内存占用更低,支持 CPU/GPU 8 位量化。
Python 异步网络库与 Web 框架,源自 FriendFeed。支持非阻塞 I/O,可扩展至数万并发连接,适用于长轮询、WebSocket 等长连接应用。
基于 Python 的自主智能体实验框架,核心为 functionz 函数管理框架,支持从数据库存储、管理与执行函数,提供图形化仪表板,适用于开发与讨论。
Python 工作流编排框架,用于构建弹性数据管道。支持调度、缓存、重试和事件驱动自动化,可自托管或使用 Prefect Cloud 监控。
构建具有高级记忆的有状态 AI 代理平台,支持本地运行和 API 集成。提供 CLI 工具与 Python/TypeScript SDK,实现 AI 的持续学习与自我改进。
本地私有文档智能平台。使用 GPT 模型与文档对话,数据永不离开设备,100% 私有。支持混合搜索、智能路由与上下文增强,纯 Python 架构,轻量易部署。
大规模跨任务、语言和模态的自监督预训练框架。涵盖语言、视觉、语音及多模态模型,如 UniLM、BEiT、WavLM 和 Kosmos 系列。包含基础架构研究,如 BitNet、RetNet、LongNet 等新型 Transformer 架构。