大语言模型资源
探索与 大语言模型 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
lyogavin/airllm
优化推理内存,单张 4GB GPU 即可运行 70B 大模型,无需量化、蒸馏或剪枝。现已支持在 8GB VRAM 上运行 405B Llama3.1。
comet-ml/opik
开源 AI 可观测性平台,提供全面追踪、自动评估和生产就绪仪表板,用于调试、评估和监控 LLM 应用、RAG 系统及智能体工作流。
swe-agent/swe-agent
基于大语言模型的自动化工具,可修复 GitHub 问题、进行网络安全攻防或编程挑战。支持配置 YAML 文件,由普林斯顿和斯坦福大学研究团队开发。
alibaba-nlp/deepresearch
Tongyi DeepResearch 是阿里云推出的开源深度研究智能体,具备 305 亿参数,每 token 仅激活 33 亿参数。专为长周期、深度信息检索任务设计,在多个智能体搜索基准测试中表现领先。
screenpipe/screenpipe
将电脑变为个人 AI,记录屏幕和音频,实现本地搜索与自动化。数据 100% 本地存储,完全私有,支持自然语言查询。
elder-plinius/l1b3rt4s
提供针对主流 AI 模型的无害化解放提示词,旨在通过特定指令集引导 AI 进入新的工作范式。
eosphoros-ai/db-gpt
AI 原生数据应用开发框架,集成 AWEL 智能体工作流表达语言与多智能体协作。支持 RAG、GBI、微调及数据驱动自进化,简化大模型应用开发。
ymcui/chinese-llama-alpaca
开源中文LLaMA与Alpaca大语言模型,扩展中文词表并基于中文数据预训练与指令精调。支持本地CPU/GPU量化部署,兼容transformers、llama.cpp等生态,提供7B/13B/33B等多版本模型。
meta-llama/llama-cookbook
官方 Llama 模型构建指南,涵盖推理、微调、RAG 及端到端应用示例。提供多种集成方案与最新 Llama 4 食谱,适用于文本与视觉模型。
tirth8205/code-review-graph
构建代码知识图谱,为 Claude Code 提供持久化代码库地图,减少 6.8 倍审查令牌和 49 倍日常编码令牌。基于 Tree-sitter 解析,支持增量更新和 MCP 集成,实现精准上下文读取。
mlc-ai/web-llm
高性能浏览器端LLM推理引擎,基于WebGPU硬件加速,无需服务器支持。完全兼容OpenAI API,支持流式输出、JSON模式和函数调用。内置Llama、Phi、Gemma、Mistral、Qwen等模型,支持自定义模型集成。
transitive-bullshit/agentic
RapidAPI for LLM tools,精选高质量 MCP 服务,支持一键发布与付费。提供 TypeScript SDK 集成,使用 Stripe 按量计费,全球边缘网络加速。
emcie-co/parlant
专为生产环境设计的 LLM 智能体框架。通过原则而非提示词确保指令遵循,支持旅程、行为准则、工具调用和领域适配,分钟级部署。
stas00/ml-engineering
开源机器学习工程手册,涵盖大语言模型与多模态模型的训练、微调及推理全流程。提供实用脚本、命令与硬件选型指南,适合工程师快速上手。
xming521/weclone
一站式从聊天记录创建数字分身。微调 LLM 捕捉独特风格,绑定聊天机器人让数字自我活起来。支持 Telegram 数据源,本地化部署保障隐私。
arc53/docsgpt
开源私有 AI 平台,用于构建智能体和助手。支持多格式文档分析、深度研究、多模型及 API 集成,提供企业级安全与可扩展部署。
rightnow-ai/openfang
开源 Agent 操作系统,基于 Rust 构建。单二进制文件,14 个 crate,1767+ 测试,零警告。自主代理 24/7 运行,支持 Clip、Lead 等预置 Hands,无需提示即可执行任务。
deepseek-ai/janus
统一多模态理解与生成模型,解耦视觉编码,支持文本和图像任务,性能超越专有模型。
modelscope/funasr
端到端语音识别工具包,支持 ASR、VAD、标点恢复、说话人验证等。提供工业级预训练模型,支持推理与微调,涵盖 Paraformer、Whisper 等模型。
pydantic/pydantic-ai
基于 Pydantic 的 GenAI Agent 框架,提供类型安全、模型无关、无缝可观测性和强大的评估功能。支持 MCP、A2A 和 UI 标准,实现人机回圈工具审批和持久化执行。
transformeroptimus/superagi
开源自主 AI 代理框架,专为开发者设计。支持快速构建、管理和运行实用的自主代理。基于 Python,拥有超过 1.7 万星标。
agentscope-ai/qwenpaw
个人 AI 助手,易安装、可本地或云端部署。支持多聊天应用,扩展性强。内置定时任务,自定义技能,内存可控。适用于社交、生产力、创意、研究和桌面场景。
microsoft/agent-lightning
零代码变更即可优化 AI 智能体,支持任何框架(如 LangChain、AutoGen)。通过强化学习、自动提示优化等算法,选择性优化多智能体系统中的一个或多个智能体。
decolua/9router
无限免费 AI 编程。连接 Claude Code、Cursor 等工具至 40+ 免费 AI 提供商。自动回退,RTK 节省 20-40% 令牌,永不限流。
googlecloudplatform/generative-ai
提供 Google Cloud 上 Gemini、Imagen、Chirp 等生成式 AI 的代码样本与 Jupyter Notebook,涵盖 Vertex AI 平台的多种应用。
kubesphere/kubesphere
面向 Kubernetes 多云、数据中心和边缘管理的容器平台。提供插件式架构、多集群管理、GitOps DevOps、可观测性及服务网格等功能。
datawhalechina/easy-vibe
面向初学者的现代编程课程,通过交互式教程和可视化学习,帮助用户逐步掌握 vibe coding,实现从零到应用的构建。
jundot/omlx
专为 Apple Silicon 优化的 LLM 推理服务器,支持连续批处理和 SSD 缓存,通过 macOS 菜单栏管理。
langbot-app/langbot
生产级多平台智能机器人开发平台,支持 QQ、微信、Discord、Slack 等即时通信平台,集成 GPT、DeepSeek、Claude 等大模型,提供 Agent、知识库、插件系统与 Web 管理面板,支持 Docker、Kubernetes 等多种部署方式。
raga-ai-hub/ragaai-catalyst
Python SDK,用于 Agent AI 可观测性、监控与评估。支持 Agent、LLM 和工具追踪,调试多智能体系统,提供自托管仪表板及带时间线和执行图视图的高级分析。