探索 大语言模型 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
🚀 快速、Pythonic 的 MCP 服务器与客户端构建框架。基于 Python,提供组件、提供者、转换三大抽象,简化协议实现,让开发者专注于业务逻辑。星标 22k+,被 70% 的 MCP 服务器采用。
面向开发者的 LLM 入门教程,基于吴恩达大模型系列课程中文版。涵盖 Prompt Engineering、RAG、模型微调等全流程,提供可运行的 Jupyter Notebook 代码与双语教程,帮助国内开发者快速上手大模型应用开发。
为 AI Agent 构建实时知识图谱的框架。支持动态数据集成、增量更新与高效检索,无需全量重算。提供语义、关键词和图谱搜索,适用于交互式、上下文感知的 AI 应用。
智能提示词优化工具,支持多模型集成与图像生成。提供 Web、桌面、Chrome 插件及 Docker 部署,纯客户端安全架构,助力高效编写高质量 AI 提示词。
基于 LLM 和 RAG 的 Python 库,支持通过自然语言与 SQL、CSV、Parquet 等数据库或数据湖对话,实现对话式数据分析。
O'Reilly《Hands-On Large Language Models》官方代码仓库,提供近300个自定义图表和Jupyter Notebook示例,帮助读者通过实践掌握大语言模型的核心概念与工具。
Token-Oriented Object Notation (TOON) 是一种紧凑、可读的 JSON 数据模型编码,专为 LLM 提示设计。结合 YAML 缩进结构与 CSV 风格的表格数组,显著减少令牌使用,同时保持 JSON 的无损转换。适用于均匀对象数组,提升模型解析可靠性。
将自然语言问题转化为 SQL 查询并获取数据洞察。支持用户权限感知、流式响应、企业级安全与可嵌入的 Web 组件。兼容多种 LLM 与数据库,提供生产就绪的 FastAPI 集成。
基于 AI 的 Python 网页抓取库,利用 LLM 和图逻辑构建抓取管道,只需指定要提取的信息即可自动完成。
开源 LLM 工程平台:提供可观测性、指标、评估、提示管理、数据集等功能。支持 OpenTelemetry、LangChain、OpenAI SDK 等集成。可自托管,Y Combinator W23。
从零构建 AI 代理,理解核心循环、工具设计、显式规划、上下文管理与知识注入。提供 v0 到 v4 的渐进式教程,代码精简,适合学习现代 AI 代理工作原理。
TypeScript AI 工具包,支持 Next.js、React 等框架。提供统一 API 接口,集成 OpenAI、Anthropic 等主流模型提供商。内置 Agent 构建能力与 UI 集成钩子,简化 AI 应用开发。
将整个代码仓库打包为单个 AI 友好文件,便于输入给 Claude、ChatGPT、Gemini 等大语言模型。支持 TypeScript,提供在线版与 CLI 工具。
通用大语言模型部署引擎,基于 ML 编译技术。支持 AMD、NVIDIA、Apple、Intel 等多平台 GPU,以及 Web、iOS、Android 等环境。提供 OpenAI 兼容 API,通过统一高性能引擎实现跨平台原生部署与优化。
大规模跨任务、语言和模态的自监督预训练框架。涵盖语言、视觉、语音及多模态模型,如 UniLM、BEiT、WavLM 和 Kosmos 系列。包含基础架构研究,如 BitNet、RetNet、LongNet 等新型 Transformer 架构。
基于云原生栈构建多模态 AI 应用。支持 gRPC、HTTP 和 WebSocket 通信,提供高性能服务设计、LLM 流式输出、内置 Docker 集成与 Executor Hub,支持一键部署至 Jina AI Cloud 及 Kubernetes。
基于 TypeScript 的 AI 应用框架,提供模型路由、智能体、工作流、人机协作、上下文管理、MCP 服务器与生产级工具,支持 React、Next.js、Node.js 集成与独立部署。
构建具有高级记忆的有状态 AI 代理平台,支持本地运行和 API 集成。提供 CLI 工具与 Python/TypeScript SDK,实现 AI 的持续学习与自我改进。
AI 驱动的浏览器自动化框架,结合自然语言与代码控制,提供灵活、可维护且可靠的网页自动化方案。支持 AI 导航与精确代码操作,具备自缓存和自修复能力,可从 AI 驱动过渡到可重复工作流。
🤗 Datasets 是一个轻量级库,提供两大核心功能:一键加载众多公共数据集,以及高效的数据预处理。支持内存映射、智能缓存和流式模式,可与 NumPy、PyTorch、TensorFlow 等框架无缝集成。
强大的编码代理工具包,提供语义检索与编辑能力。支持 MCP 服务器等多种集成方式,可将 LLM 转变为直接在代码库上工作的全功能代理。免费开源,无需绑定特定 LLM 或框架。
终端编程新搭档,支持多 LLM 模型、会话管理、LSP 增强与 MCP 扩展,跨平台运行于 macOS、Linux、Windows 等系统。
强大的 GUI 应用和工具包,用于 Claude Code。创建自定义代理、管理交互式会话、运行安全后台代理、追踪使用成本、管理 MCP 服务器,并提供可视化时间线与检查点功能。
开源 AI 黑客工具,自动发现并修复应用漏洞。支持 CI/CD 集成,提供真实 PoC 验证,配备完整黑客工具包,团队协作代理,开发者友好 CLI。
🤗 PEFT:最先进的参数高效微调库。仅微调少量参数,即可高效适配大模型至下游任务,显著降低计算与存储成本。与 Transformers、Diffusers 和 Accelerate 深度集成,支持 LoRA 等多种方法。
使用 LLM 和计算机视觉自动化浏览器工作流,提供简单 API 端点,替代脆弱的自动化方案。基于视觉理解,无需定制代码即可适应新网站,抗布局变化,支持复杂推理。
通义千问官方仓库,提供 Qwen 系列大语言模型,包括 1.8B、7B、14B、72B 参数的基座与对话模型。支持 Hugging Face、ModelScope、Demo 及 API,已开源。