探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
使用 LLM 和计算机视觉自动化浏览器工作流,提供简单 API 端点,替代脆弱的自动化方案。基于视觉理解,无需定制代码即可适应新网站,抗布局变化,支持复杂推理。
基于云原生栈构建多模态 AI 应用。支持 gRPC、HTTP 和 WebSocket 通信,提供高性能服务设计、LLM 流式输出、内置 Docker 集成与 Executor Hub,支持一键部署至 Jina AI Cloud 及 Kubernetes。
提供 AI 代理技能目录,包含指令、脚本和资源。支持一次编写,随处使用,帮助团队以可重复方式完成特定任务。可通过 Codex 安装和分发技能。
Python爬虫从零到一教程,涵盖浏览器与APP抓包、Requests/Selenium/Appium/Scrapy等库、IP代理、验证码识别、数据库存储、多线程/多进程、JS逆向及分布式爬虫实战。
提供推荐系统最佳实践,包含经典与前沿算法示例。支持数据准备、模型构建、评估、优化及生产部署,适用于研究与开发。
小米官方支持的 Home Assistant 集成组件,支持多种小米 IoT 智能设备。提供 Git、HACS 及手动安装方式,支持多账户登录与调试模式,需注意配置文件安全。
轻量级多智能体编排框架,专注于协调与执行。通过 Agent 和 handoff 抽象,实现可扩展的实时解决方案。已由 OpenAI Agents SDK 取代,适用于教育探索。
🤗 Datasets 是一个轻量级库,提供两大核心功能:一键加载众多公共数据集,以及高效的数据预处理。支持内存映射、智能缓存和流式模式,可与 NumPy、PyTorch、TensorFlow 等框架无缝集成。
通过与 AI 结对编程,将想法变为现实的终极工作站。支持多语言,提供构建状态、版本、许可证等徽章,以及 Telegram 交流群。
基于大语言模型的多语种语音生成系统,支持零样本克隆与流式推理。覆盖9种语言及18+中方言,提供发音修复、文本归一化与指令控制。性能领先,延迟低至150ms,适用于生产环境。
领先的开源数据集成平台,支持从 API、数据库和文件到数据仓库、数据湖和湖仓的 ETL/ELT 管道。提供 600+ 连接器,支持自托管和云托管,可通过无代码构建器或低代码 SDK 快速创建连接器。
一个用于 Python 的反应式笔记本,可运行可复现实验、用 SQL 查询、作为脚本执行、作为应用部署,并使用 git 进行版本控制。存储为纯 Python 文件,配备现代化、AI 原生的编辑器。
通义千问官方仓库,提供 Qwen 系列大语言模型,包括 1.8B、7B、14B、72B 参数的基座与对话模型。支持 Hugging Face、ModelScope、Demo 及 API,已开源。
🤗 PEFT:最先进的参数高效微调库。仅微调少量参数,即可高效适配大模型至下游任务,显著降低计算与存储成本。与 Transformers、Diffusers 和 Accelerate 深度集成,支持 LoRA 等多种方法。
开源机器学习框架,用于自动化文本和语音对话:NLU、对话管理,支持 Slack、Facebook 等平台,构建聊天机器人和语音助手。目前进入维护模式,未来聚焦于 Hello Rasa 和 CALM。
开源企业级智能体平台,支持 RAG 管道、工作流编排和 MCP 工具调用。提供多模态输入输出,兼容各类大模型,可快速集成至第三方系统。
基于 Python 的检索插件,通过自然语言查询实现个人或工作文档的语义搜索。支持多种向量数据库,可作为独立后端与 ChatGPT 自定义 GPT、函数调用或助手 API 集成。
⚡️ 轻量级高效 AI 证件照工具,支持离线抠图、多尺寸生成与美颜。基于 Python,提供 Gradio Demo、API 服务与 Docker 部署。
全栈式 RAG 框架,基于 LightRAG 构建。支持多模态数据处理,整合文本、图像、表格与公式。提供 VLM 增强查询与上下文感知能力,实现智能信息检索与分析。
收录 300+ 免费 ChatGPT 镜像网站,持续更新。提供 GPT-4、Claude 等模型支持,包含公益站点与开发者工具。⚠️ 注意:请勿输入敏感信息。
工业级可控高效零样本语音合成系统。支持自回归生成与精确时长控制,实现情感与音色解耦。通过 GPT 潜在表征与三阶段训练提升稳定性,支持多模态情感引导。
压缩工具输出、日志、文件和 RAG 块,减少 60-95% token,保持答案相同。提供库、代理、MCP 服务器,支持 Python 和 TypeScript,本地优先、可逆。
开放神经网络交换标准,为 AI 模型提供开源格式,支持深度学习和传统机器学习。定义可扩展的计算图模型、内置算子和标准数据类型,专注于推理能力。广泛支持多种框架、工具和硬件,促进 AI 社区创新。
网络自动化的核心源数据,提供全面的网络基础设施建模与文档化。支持 IPAM、DCIM、设备配置管理,拥有强大 API 和灵活权限系统,是现代网络的单一事实来源。
Google Research 开发的时序基础模型,支持多语言与多后端。提供 2.5 版本,参数量 200M,上下文长度达 16k,支持连续分位数预测。可通过 pip 安装,提供 PyTorch 与 Flax 推理接口。
将多个 LLM 组成“议会”,用户提问后,各模型独立生成初答,随后匿名互评并排名,最终由“主席”模型整合出最终答案。支持本地 Web 界面,通过 OpenRouter 调用多模型,便于对比评估。
实时 AI 声音转换软件,支持 RVC、Beatrice 等多种模型。提供独立与网络模式,兼容 Windows、Mac、Linux 平台,支持 REST API 调用。
基于 Django 的开源 CMS,专注于用户体验与灵活性。提供快速界面、完整前端控制、可扩展至百万页面。支持 StreamField、多站点、多语言及内容 API,适用于各类规模项目。