探索 大语言模型 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
cleanlab/cleanlab
用于数据质量和带有杂乱、真实世界数据及标签的机器学习的标准数据驱动AI包。
microsoft/promptflow
构建高质量的LLM应用 - 从原型设计、测试到生产部署和监控。
mistralai/mistral-inference
Mistral模型的官方推理库
explodinggradients/ragas
为您的LLM应用评估加速 🚀
doocs/md
✍ 微信 Markdown 编辑器 | 一款高度简洁的微信 Markdown 编辑器:支持 Markdown 语法、自定义主题样式、内容管理、多图床、AI 助手等特性
axolotl-ai-cloud/axolotl
继续提问关于axolotl的问题
ConardLi/easy-dataset
一个用于为大型语言模型创建微调数据集的强大工具
NirDiamant/agents-towards-production
本仓库提供从头到尾、以代码为主的教程,涵盖生产级别的GenAI代理的每一层,通过经过验证的模式和可重用的蓝图指导你从创意到扩展,适用于实际发布的全流程。
steven2358/awesome-generative-ai
一份精心整理的现代生成式人工智能项目和服务列表
Canner/WrenAI
⚡️Wren AI 是你的生成式生物信息学代理,你可以用自然语言查询任何数据库 → 在几秒钟内获得准确的 SQL(文本转SQL)、图表(文本转图表)和 AI 生成的洞见。
tensorzero/tensorzero
TensorZero 是一个用于工业级 LLM 应用的开源堆栈。它统一了 LLM 网关、可观测性、优化、评估和实验功能。
dataelement/bisheng
BISHENG 是一个用于下一代企业人工智能应用的开源 LLM DevOps 平台。其强大而全面的功能包括:生成式 AI 工作流、RAG、Agent、统一模型管理、评估、SFT、数据集管理、企业级系统管理、可观测性等。
Netflix/metaflow
构建、管理和部署AI/ML系统
modelscope/ms-swift
使用PEFT或全参数方法对500+个大语言模型(Qwen3、Qwen3-MoE、Llama4、InternLM3、DeepSeek-R1、...)和200+个多模态语言模型(Qwen2.5-VL、Qwen2.5-Omni、Qwen2-Audio、Ovis2、InternVL3、Llava、GLM4v、Phi4、...)进行CPT/SFT/DPO/GRPO训练(AAAI 2025)。
e2b-dev/E2B
安全的开源云运行时,适用于AI应用和AI代理。
tadata-org/fastapi_mcp
将您的 FastAPI 接口暴露为带有身份验证的模型上下文协议(MCP)工具!
wdndev/llm_interview_note
主要记录大语言大模型(LLMs)算法(应用)工程师相关的知识及面试题
Portkey-AI/gateway
一个极其快速的AI网关,带有集成的安全护栏。通过一个快速且友好的API,路由到200多个大语言模型和50多个AI安全护栏。
jina-ai/reader
将任何URL转换为适合LLM的输入,只需一个简单的前缀 https://r.jina.ai/
huggingface/chat-ui
为HuggingChat应用程序提供支持的开源代码库
activeloopai/deeplake
用于AI的数据库。存储向量、图像、文本、视频等。与LLM/LangChain一起使用。存储、查询、版本控制并可视化任何AI数据。实时流式传输数据至PyTorch/TensorFlow。https://activeloop.ai
OpenGVLab/InternVL
[CVPR 2024 Oral] InternVL系列:一个开创性的GPT-4o开源替代方案。接近GPT-4o表现的开源多模态对话模型