大语言模型资源
探索与 大语言模型 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
prefecthq/fastmcp
🚀 快速、Pythonic 的 MCP 服务器与客户端构建框架。基于 Python,提供组件、提供者、转换三大抽象,简化协议实现,让开发者专注于业务逻辑。星标 22k+,被 70% 的 MCP 服务器采用。
datawhalechina/llm-cookbook
面向开发者的 LLM 入门教程,基于吴恩达大模型系列课程中文版。涵盖 Prompt Engineering、RAG、模型微调等全流程,提供可运行的 Jupyter Notebook 代码与双语教程,帮助国内开发者快速上手大模型应用开发。
liguodongiot/llm-action
分享大模型技术原理与实战经验,涵盖训练、推理、压缩、应用开发及工程化落地,提供丰富教程与算力支持。
getzep/graphiti
为 AI Agent 构建实时知识图谱的框架。支持动态数据集成、增量更新与高效检索,无需全量重算。提供语义、关键词和图谱搜索,适用于交互式、上下文感知的 AI 应用。
linshenkx/prompt-optimizer
智能提示词优化工具,支持多模型集成与图像生成。提供 Web、桌面、Chrome 插件及 Docker 部署,纯客户端安全架构,助力高效编写高质量 AI 提示词。
sinaptik-ai/pandas-ai
基于 LLM 和 RAG 的 Python 库,支持通过自然语言与 SQL、CSV、Parquet 等数据库或数据湖对话,实现对话式数据分析。
handsonllm/hands-on-large-language-models
O'Reilly《Hands-On Large Language Models》官方代码仓库,提供近300个自定义图表和Jupyter Notebook示例,帮助读者通过实践掌握大语言模型的核心概念与工具。
toon-format/toon
Token-Oriented Object Notation (TOON) 是一种紧凑、可读的 JSON 数据模型编码,专为 LLM 提示设计。结合 YAML 缩进结构与 CSV 风格的表格数组,显著减少令牌使用,同时保持 JSON 的无损转换。适用于均匀对象数组,提升模型解析可靠性。
vanna-ai/vanna
将自然语言问题转化为 SQL 查询并获取数据洞察。支持用户权限感知、流式响应、企业级安全与可嵌入的 Web 组件。兼容多种 LLM 与数据库,提供生产就绪的 FastAPI 集成。
scrapegraphai/scrapegraph-ai
基于 AI 的 Python 网页抓取库,利用 LLM 和图逻辑构建抓取管道,只需指定要提取的信息即可自动完成。
langfuse/langfuse
开源 LLM 工程平台:提供可观测性、指标、评估、提示管理、数据集等功能。支持 OpenTelemetry、LangChain、OpenAI SDK 等集成。可自托管,Y Combinator W23。
shareai-lab/learn-claude-code
从零构建 AI 代理,理解核心循环、工具设计、显式规划、上下文管理与知识注入。提供 v0 到 v4 的渐进式教程,代码精简,适合学习现代 AI 代理工作原理。
vercel/ai
TypeScript AI 工具包,支持 Next.js、React 等框架。提供统一 API 接口,集成 OpenAI、Anthropic 等主流模型提供商。内置 Agent 构建能力与 UI 集成钩子,简化 AI 应用开发。
hqwu-hitcs/awesome-chinese-llm
整理开源中文大语言模型,聚焦小规模、可私有化部署、低成本训练的模型,涵盖底座、垂直领域微调、应用、数据集与教程等资源。
yamadashy/repomix
将整个代码仓库打包为单个 AI 友好文件,便于输入给 Claude、ChatGPT、Gemini 等大语言模型。支持 TypeScript,提供在线版与 CLI 工具。
mlc-ai/mlc-llm
通用大语言模型部署引擎,基于 ML 编译技术。支持 AMD、NVIDIA、Apple、Intel 等多平台 GPU,以及 Web、iOS、Android 等环境。提供 OpenAI 兼容 API,通过统一高性能引擎实现跨平台原生部署与优化。
microsoft/unilm
大规模跨任务、语言和模态的自监督预训练框架。涵盖语言、视觉、语音及多模态模型,如 UniLM、BEiT、WavLM 和 Kosmos 系列。包含基础架构研究,如 BitNet、RetNet、LongNet 等新型 Transformer 架构。
jina-ai/serve
基于云原生栈构建多模态 AI 应用。支持 gRPC、HTTP 和 WebSocket 通信,提供高性能服务设计、LLM 流式输出、内置 Docker 集成与 Executor Hub,支持一键部署至 Jina AI Cloud 及 Kubernetes。
mastra-ai/mastra
基于 TypeScript 的 AI 应用框架,提供模型路由、智能体、工作流、人机协作、上下文管理、MCP 服务器与生产级工具,支持 React、Next.js、Node.js 集成与独立部署。
letta-ai/letta
构建具有高级记忆的有状态 AI 代理平台,支持本地运行和 API 集成。提供 CLI 工具与 Python/TypeScript SDK,实现 AI 的持续学习与自我改进。
browserbase/stagehand
AI 驱动的浏览器自动化框架,结合自然语言与代码控制,提供灵活、可维护且可靠的网页自动化方案。支持 AI 导航与精确代码操作,具备自缓存和自修复能力,可从 AI 驱动过渡到可重复工作流。
huggingface/datasets
🤗 Datasets 是一个轻量级库,提供两大核心功能:一键加载众多公共数据集,以及高效的数据预处理。支持内存映射、智能缓存和流式模式,可与 NumPy、PyTorch、TensorFlow 等框架无缝集成。
oraios/serena
强大的编码代理工具包,提供语义检索与编辑能力。支持 MCP 服务器等多种集成方式,可将 LLM 转变为直接在代码库上工作的全功能代理。免费开源,无需绑定特定 LLM 或框架。
charmbracelet/crush
终端编程新搭档,支持多 LLM 模型、会话管理、LSP 增强与 MCP 扩展,跨平台运行于 macOS、Linux、Windows 等系统。
winfunc/opcode
强大的 GUI 应用和工具包,用于 Claude Code。创建自定义代理、管理交互式会话、运行安全后台代理、追踪使用成本、管理 MCP 服务器,并提供可视化时间线与检查点功能。
usestrix/strix
开源 AI 黑客工具,自动发现并修复应用漏洞。支持 CI/CD 集成,提供真实 PoC 验证,配备完整黑客工具包,团队协作代理,开发者友好 CLI。
huggingface/peft
🤗 PEFT:最先进的参数高效微调库。仅微调少量参数,即可高效适配大模型至下游任务,显著降低计算与存储成本。与 Transformers、Diffusers 和 Accelerate 深度集成,支持 LoRA 等多种方法。
vectifyai/pageindex
基于推理的无向量RAG系统,无需向量数据库与分块,通过树状索引实现类人检索,提升长文档处理的准确性与可解释性。
skyvern-ai/skyvern
使用 LLM 和计算机视觉自动化浏览器工作流,提供简单 API 端点,替代脆弱的自动化方案。基于视觉理解,无需定制代码即可适应新网站,抗布局变化,支持复杂推理。
qwenlm/qwen
通义千问官方仓库,提供 Qwen 系列大语言模型,包括 1.8B、7B、14B、72B 参数的基座与对话模型。支持 Hugging Face、ModelScope、Demo 及 API,已开源。