大语言模型资源
探索与 大语言模型 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
tencent/weknora
基于 RAG 范式的 LLM 驱动框架,用于深度文档理解、语义检索和上下文感知问答。支持多模态预处理、向量索引与智能推理。
confident-ai/deepeval
开源 LLM 评估框架,类似 Pytest 用于单元测试。支持多种指标,如 G-Eval、RAG 与智能体指标,可本地运行 NLP 模型评估。适用于 RAG、Agent 等应用,帮助优化模型与提示词。
cft0808/edict
基于唐代三省六部制的 AI 多 Agent 协作系统,含 9 个专业智能体、实时看板与完整审计轨迹,支持任务干预与模型热切换。
hkuds/deepcode
开源智能体编码框架,支持 Paper2Code、Text2Web 和 Text2Backend。基于 Python,利用多智能体系统推进代码生成。
treeverse/dvc
数据版本控制与机器学习实验管理工具。支持 Git 风格的数据和模型版本管理,轻量级流水线迭代,本地实验跟踪与对比,以及可复现的实验分享。
memvid/memvid
为 AI Agent 提供单文件内存层,替代复杂 RAG 管道。实现无服务器、持久化、版本化内存,支持即时检索与长期记忆。
zai-org/chatglm2-6b
开源中英双语对话大模型,基于 GLM 架构,支持 32K 上下文。性能强劲,在 MMLU、CEval 等基准测试中表现优异。推理高效,支持 6G 显存运行,可免费商用。
googleapis/mcp-toolbox
开源 MCP 数据库服务器,简化 Gen AI 工具开发。提供连接池、认证等最佳实践,支持端到端可观测性。可将 AI 助手连接至 IDE,实现自然语言查询、自动化管理与上下文感知代码生成。
canner/wrenai
⚡️ GenBI 代理,通过自然语言查询任何数据库,秒级生成精准 SQL、图表及 AI 驱动的商业智能。支持语义层、API 嵌入及多种数据源。
liyupi/ai-guide
免费AI知识库,涵盖大模型指南、Vibe Coding零基础教程、Prompt大全、AI编程技巧、工具用法及变现指南,助你快速掌握AI技术。
alibaba/mnn
轻量级高性能深度学习框架,支持端侧推理与训练。已集成至阿里内部30+应用,覆盖直播、搜索推荐等70+场景。提供多模态LLM及Diffusion模型的本地部署方案,支持Qwen、LLaMA等主流模型。
plandex-ai/plandex
开源 AI 编程代理,专为大型项目和现实任务设计。基于 Go 开发,支持终端操作,可处理高达 200 万 token 的上下文。提供累积差异审查沙盒,确保变更安全可控。支持 Anthropic、OpenAI、Google 及开源模型组合,实现全自主或精细控制的工作流。
memorilabs/memori
SQL 原生记忆层,为 LLM、AI 智能体及多智能体系统提供持久化记忆。Python 实现,LLM、数据存储与框架无关,无缝集成现有架构。支持向量化记忆与语义搜索,自动模式迁移。
mukul975/anthropic-cybersecurity-skills
提供 754 个结构化网络安全技能,覆盖 26 个安全领域,映射至 MITRE ATT&CK、NIST CSF 2.0 等 5 大框架,兼容 20+ AI 平台,采用 Apache 2.0 许可。
rowboatlabs/rowboat
开源 AI 协作者,具备记忆功能。连接邮件和会议笔记,构建知识图谱,辅助完成工作。支持本地运行,数据私有。可生成 PDF、会议简报等。支持语音备忘录。
anionex/banana-slides
基于 nano banana pro🍌 的原生 AI PPT 生成应用,支持上传任意模板与素材,通过一句话/大纲/页面描述自动生成 PPT,并能通过口头指令进行局部修改,一键导出可编辑的 PPTX/PDF,实现真正的“Vibe PPT”。
unstructured-io/unstructured
开源 ETL 解决方案,将复杂文档转换为语言模型所需的干净结构化数据。支持生产级工作流、分区、丰富、分块和嵌入。
llmware-ai/llmware
统一框架,支持 300+ 模型与 RAG 管道,优化本地、私有、安全的企业级应用。支持 GGUF、OpenVINO 等多种推理技术,提供模型目录与知识库管理,可在 AI PC 和边缘设备运行。
botpress/botpress
开源平台,用于构建和部署基于 GPT/LLM 的智能体。提供 CLI、SDK 和集成开发工具,支持快速开发聊天机器人。
llamachinese/llama-chinese
Llama中文社区,实时汇总最新Llama学习资料,构建最好的中文Llama大模型开源生态,完全开源可商用。提供模型、算力、数据、论坛等资源,支持Llama2、Llama3、Llama4全系列,涵盖预训练、微调、量化、部署等全流程。
jujumilk3/leaked-system-prompts
收集来自主流 LLM 服务的泄露系统提示,提供可验证来源或可复现提示,支持 PR 提交与 Issues 链接,避免包含敏感商业代码。
browser-use/browser-harness
基于 CDP 的自愈式浏览器操控框架,赋予 LLM 完成任意浏览器任务的完全自由。无需框架,直接连接 Chrome,支持动态编写缺失功能。
modelscope/ms-swift
支持600+文本大模型与300+多模态大模型的微调与部署框架,集成PEFT/全参训练、DPO/GRPO等对齐算法,提供从训练到推理、评估、量化的全栈能力。
wdndev/llm_interview_note
整理大语言模型(LLMs)算法工程师相关知识及面试题,涵盖基础、架构、训练、微调等。提供多个动手实践项目,如 tiny-llm-zh、tiny-rag 等,帮助快速掌握大模型技术。
conardli/easy-dataset
专为 LLM 微调、RAG 和评估构建数据集的强大工具。支持 PDF、DOCX 等多种格式文档的智能解析与分割,自动生成高质量 QA 数据集。内置评估系统,支持自动化模型评测与人工盲测,助力垂直领域模型优化。
jnmetacode/agency-agents-zh
193 个即插即用 AI 专家角色,覆盖 18 个部门,支持 14 种工具,含 46 个中国市场原创智能体,如小红书/抖音运营。
vibrantlabsai/ragas
为 LLM 应用提供客观指标、智能测试生成和数据驱动洞察的评估工具包。支持 LangChain 等框架集成,通过预构建指标和自定义评估,提升应用性能。
geeeekexplorer/nano-vllm
轻量级 vLLM 实现,从零构建。提供快速离线推理、可读代码库及优化套件,如前缀缓存、张量并行、Torch 编译和 CUDA 图。性能媲美 vLLM,代码约 1200 行 Python。
dottxt-ai/outlines
为 LLM 提供结构化输出,确保生成时即符合指定类型。支持任意模型,集成简单,无需后处理解析。核心功能包括类型安全输出、复杂结构定义及多模型兼容。
nvidia/tensorrt-llm
提供易用的 Python API 定义大语言模型,支持前沿优化以在 NVIDIA GPU 上高效推理。包含 Python 和 C++ 运行时组件,实现高性能推理编排。