大语言模型开源项目、教程与资源

jina-ai/serve

21.9k

2.2k

25

基于云原生栈构建多模态 AI 应用。支持 gRPC、HTTP 和 WebSocket 通信，提供高性能服务设计、LLM 流式输出、内置 Docker 集成与 Executor Hub，支持一键部署至 Jina AI Cloud 及 Kubernetes。

Python

Docker

Kubernetes

Prometheus

1641.7 MB

2025-03-24

huggingface/datasets

21.8k

3.3k

1.2k

🤗 Datasets 是一个轻量级库，提供两大核心功能：一键加载众多公共数据集，以及高效的数据预处理。支持内存映射、智能缓存和流式模式，可与 NumPy、PyTorch、TensorFlow 等框架无缝集成。

Python

Pandas

PyTorch

TensorFlow

113.3 MB

2026-07-28

qwenlm/qwen

21.5k

1.9k

45

通义千问官方仓库，提供 Qwen 系列大语言模型，包括 1.8B、7B、14B、72B 参数的基座与对话模型。支持 Hugging Face、ModelScope、Demo 及 API，已开源。

Python

大语言模型

36.5 MB

2026-03-05

huggingface/peft

21.5k

2.4k

55

🤗 PEFT：最先进的参数高效微调库。仅微调少量参数，即可高效适配大模型至下游任务，显著降低计算与存储成本。与 Transformers、Diffusers 和 Accelerate 深度集成，支持 LoRA 等多种方法。

Python

PyTorch

大语言模型

26.5 MB

2026-07-27

nirdiamant/agents-towards-production

21.2k

2.8k

12

开源教程库，提供端到端、代码优先的 GenAI 代理生产级教程。涵盖状态工作流、向量记忆、实时搜索、Docker 部署、FastAPI、安全护栏、GPU 扩展、浏览器自动化、微调、多代理协调、可观测性、评估和 UI 开发，从原型到企业级部署。

Jupyter Notebook

大语言模型

153.8 MB

2026-07-15

dyad-sh/dyad

21.1k

2.6k

254

本地开源 AI 应用构建器，快速、私密、完全自主控制。支持自定义 API 密钥，跨平台运行，无需注册即可下载使用。

TypeScript

React

大语言模型

Next.js

46.7 MB

2026-07-28

comet-ml/opik

20.9k

1.6k

158

开源 AI 可观测性平台，提供全面追踪、自动评估和生产就绪仪表板，用于调试、评估和监控 LLM 应用、RAG 系统及智能体工作流。

Python

大语言模型

679.2 MB

2026-07-28

google/adk-python

20.9k

3.8k

602

开源、代码优先的 Python 工具包，用于构建、评估和部署复杂 AI 智能体。支持灵活编排、多智能体系统，可部署于 Cloud Run 或 Vertex AI。提供丰富工具生态和 Agent Config 功能。

Python

大语言模型

70.3 MB

2026-07-28

davideuler/architecture.of.internet-product

20.8k

4.7k

10

收集微信、淘宝、腾讯、阿里、美团、百度、OpenAI、Google、Facebook、Amazon、eBay 等互联网公司的经典技术架构，按公司和主题分类，欢迎 PR 补充。

HTML

大语言模型

825.7 MB

2024-02-17

elder-plinius/l1b3rt4s

20.7k

2.6k

76

提供针对主流 AI 模型的无害化解放提示词，旨在通过特定指令集引导 AI 进入新的工作范式。

大语言模型

安全

1.0 MB

2026-02-17

screenpipe/screenpipe

20.6k

2.0k

115

将电脑变为个人 AI，记录屏幕和音频，实现本地搜索与自动化。数据 100% 本地存储，完全私有，支持自然语言查询。

Rust

大语言模型

489.1 MB

2026-07-28

can1357/oh-my-pi

20.3k

1.9k

789

终端 AI 编码代理，支持哈希锚点编辑、优化工具链、LSP、Python、浏览器和子代理。基于 TypeScript 构建，集成 IDE 功能，提供 40+ 提供商、32 种内置工具和 Rust 核心。

TypeScript

大语言模型

429.0 MB

2026-07-28

kortix-ai/suna

20.0k

3.4k

40

Kortix 是一个完整的 AI Agent 平台，用于构建、管理和训练自主工作的智能体。支持浏览器自动化、文件管理、数据分析和系统操作，提供可视化工具和 Kortix Super Worker 示例，帮助用户创建定制化 Agent 以处理复杂任务。

TypeScript

大语言模型

308.5 MB

2026-07-28

swe-agent/swe-agent

19.9k

2.2k

52

基于大语言模型的自动化工具，可修复 GitHub 问题、进行网络安全攻防或编程挑战。支持配置 YAML 文件，由普林斯顿和斯坦福大学研究团队开发。

Python

大语言模型

安全

70.5 MB

2026-07-28

alibaba-nlp/deepresearch

19.7k

1.5k

91

Tongyi DeepResearch 是阿里云推出的开源深度研究智能体，具备 305 亿参数，每 token 仅激活 33 亿参数。专为长周期、深度信息检索任务设计，在多个智能体搜索基准测试中表现领先。

Python

大语言模型

302.2 MB

2026-02-27

eosphoros-ai/db-gpt

19.6k

2.8k

417

AI 原生数据应用开发框架，集成 AWEL 智能体工作流表达语言与多智能体协作。支持 RAG、GBI、微调及数据驱动自进化，简化大模型应用开发。

Python

大语言模型

安全

459.9 MB

2026-07-28

modelscope/funasr

19.5k

2.0k

2

端到端语音识别工具包，支持 ASR、VAD、标点恢复、说话人验证等。提供工业级预训练模型，支持推理与微调，涵盖 Paraformer、Whisper 等模型。

Python

PyTorch

大语言模型

119.7 MB

2026-07-27

tencent/weknora

19.0k

2.7k

531

基于 RAG 范式的 LLM 驱动框架，用于深度文档理解、语义检索和上下文感知问答。支持多模态预处理、向量索引与智能推理。

Go

大语言模型

77.6 MB

2026-07-28

ymcui/chinese-llama-alpaca

18.9k

1.8k

6

开源中文LLaMA与Alpaca大语言模型，扩展中文词表并基于中文数据预训练与指令精调。支持本地CPU/GPU量化部署，兼容transformers、llama.cpp等生态，提供7B/13B/33B等多版本模型。

Python

大语言模型

23.5 MB

2026-04-19

pydantic/pydantic-ai

18.9k

2.4k

530

基于 Pydantic 的 GenAI Agent 框架，提供类型安全、模型无关、无缝可观测性和强大的评估功能。支持 MCP、A2A 和 UI 标准，实现人机回圈工具审批和持久化执行。

Python

大语言模型

210.5 MB

2026-07-28

datawhalechina/easy-vibe

18.6k

1.8k

16

面向初学者的现代编程课程，通过交互式教程和可视化学习，帮助用户逐步掌握 vibe coding，实现从零到应用的构建。

JavaScript

VS Code

大语言模型

Next.js

450.8 MB

2026-07-06

meta-llama/llama-cookbook

18.5k

2.8k

88

官方 Llama 模型构建指南，涵盖推理、微调、RAG 及端到端应用示例。提供多种集成方案与最新 Llama 4 食谱，适用于文本与视觉模型。

Jupyter Notebook

PyTorch

大语言模型

273.4 MB

2026-05-20

kkkkhazix/khazix-skills

18.5k

2.1k

34

开源 AI 工具箱，提供 Prompts 和 Skills。Prompts 轻量即用，Skills 遵循 Agent 标准，支持自动加载。核心功能包括横纵分析法与公众号长文写作。

Python

大语言模型

278 KB

2026-07-28

stas00/ml-engineering

18.5k

1.2k

2

开源机器学习工程手册，涵盖大语言模型与多模态模型的训练、微调及推理全流程。提供实用脚本、命令与硬件选型指南，适合工程师快速上手。

Python

PyTorch

大语言模型

24.6 MB

2026-07-28

mlc-ai/web-llm

18.5k

1.3k

149

高性能浏览器端LLM推理引擎，基于WebGPU硬件加速，无需服务器支持。完全兼容OpenAI API，支持流式输出、JSON模式和函数调用。内置Llama、Phi、Gemma、Mistral、Qwen等模型，支持自定义模型集成。

TypeScript

大语言模型

67.3 MB

2026-06-09

jnmetacode/agency-agents-zh

18.4k

3.1k

3

193 个即插即用 AI 专家角色，覆盖 18 个部门，支持 14 种工具，含 46 个中国市场原创智能体，如小红书/抖音运营。

Shell

大语言模型

3.8 MB

2026-07-27

jundot/omlx

18.2k

1.6k

748

专为 Apple Silicon 优化的 LLM 推理服务器，支持连续批处理和 SSD 缓存，通过 macOS 菜单栏管理。

Python

大语言模型

57.2 MB

2026-07-28

emcie-co/parlant

18.2k

1.5k

42

专为生产环境设计的 LLM 智能体框架。通过原则而非提示词确保指令遵循，支持旅程、行为准则、工具调用和领域适配，分钟级部署。

Python

大语言模型

86.7 MB

2026-07-13

arc53/docsgpt

18.1k

2.1k

91

开源私有 AI 平台，用于构建智能体和助手。支持多格式文档分析、深度研究、多模型及 API 集成，提供企业级安全与可扩展部署。

Python

React

PyTorch

大语言模型

95.1 MB

2026-07-28

transitive-bullshit/agentic

18.1k

2.2k

15

RapidAPI for LLM tools，精选高质量 MCP 服务，支持一键发布与付费。提供 TypeScript SDK 集成，使用 Stripe 按量计费，全球边缘网络加速。

TypeScript

大语言模型

16.6 MB

2026-02-11

大语言模型资源

相关开源项目

jina-ai/serve

huggingface/datasets

qwenlm/qwen

huggingface/peft

nirdiamant/agents-towards-production

dyad-sh/dyad

comet-ml/opik

google/adk-python

davideuler/architecture.of.internet-product

elder-plinius/l1b3rt4s

screenpipe/screenpipe

can1357/oh-my-pi

kortix-ai/suna

swe-agent/swe-agent

alibaba-nlp/deepresearch

eosphoros-ai/db-gpt

modelscope/funasr

tencent/weknora

ymcui/chinese-llama-alpaca

pydantic/pydantic-ai

datawhalechina/easy-vibe

meta-llama/llama-cookbook

kkkkhazix/khazix-skills

stas00/ml-engineering

mlc-ai/web-llm

jnmetacode/agency-agents-zh

jundot/omlx

emcie-co/parlant

arc53/docsgpt

transitive-bullshit/agentic