大语言模型资源
探索与 大语言模型 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
simonw/llm
从命令行访问大型语言模型
steven2358/awesome-generative-ai
一份精心整理的现代生成式人工智能项目和服务列表
activeloopai/deeplake
用于AI的数据库。存储向量、图像、文本、视频等。与LLM/LangChain一起使用。存储、查询、版本控制并可视化任何AI数据。实时流式传输数据至PyTorch/TensorFlow。https://activeloop.ai
Canner/WrenAI
⚡️Wren AI 是你的生成式生物信息学代理,你可以用自然语言查询任何数据库 → 在几秒钟内获得准确的 SQL(文本转SQL)、图表(文本转图表)和 AI 生成的洞见。
openvinotoolkit/openvino
OpenVINO™ 是一个用于优化和部署 AI 推理的开源工具包
microsoft/TypeChat
TypeChat 是一个使用类型构建自然语言接口的库。
OpenGVLab/InternVL
[CVPR 2024 Oral] InternVL系列:一个开创性的GPT-4o开源替代方案。接近GPT-4o表现的开源多模态对话模型
fishaudio/Bert-VITS2
带有多种语言Bert的VITS2骨干
kyrolabs/awesome-langchain
😎 LangChain框架的优秀工具和项目的汇总列表
modelscope/ms-swift
使用PEFT或全参数方法对500+个大语言模型(Qwen3、Qwen3-MoE、Llama4、InternLM3、DeepSeek-R1、...)和200+个多模态语言模型(Qwen2.5-VL、Qwen2.5-Omni、Qwen2-Audio、Ovis2、InternVL3、Llava、GLM4v、Phi4、...)进行CPT/SFT/DPO/GRPO训练(AAAI 2025)。
GreyDGL/PentestGPT
一个由GPT驱动的渗透测试工具
coaidev/coai
🚀 下一代 AI 一站式 B/C 端解决方案,支持 OpenAI,Midjourney,Claude,讯飞星火,Stable Diffusion,DALL·E,ChatGLM,通义千问,腾讯混元,360 智脑,百川 AI,火山方舟,新必应,Gemini,Moonshot 等模型,支持对话分享,自定义预设,云端同步,模型市场,支持弹性计费和订阅计划模式,支持图片解析,支持联网搜索,支持模型缓存,丰富美观的后台管理与仪表盘数据统计。
wdndev/llm_interview_note
主要记录大语言大模型(LLMs)算法(应用)工程师相关的知识及面试题
nebuly-ai/optimate
一组用于优化人工智能模型性能的库
tensorzero/tensorzero
TensorZero 是一个用于工业级 LLM 应用的开源堆栈。它统一了 LLM 网关、可观测性、优化、评估和实验功能。
skypilot-org/skypilot
SkyPilot:在任何基础设施(Kubernetes 或 16+ 云)上运行 AI 和批处理任务。通过简单接口获得统一的执行、成本节约和高 GPU 可用性。
oumi-ai/oumi
轻松微调、评估和部署通义千问3、DeepSeek-R1、Llama 4 或任何开源的LLM/VLM!
SJTU-IPADS/PowerInfer
高速本地部署大语言模型服务
xorbitsai/inference
通过更改一行代码,用另一个大语言模型替换你应用中的 OpenAI GPT。Xinference 让你可以自由使用任何所需的大语言模型。借助 Xinference,你可以运行任何开源语言模型、语音识别模型和多模态模型的推理,无论是在云端、本地还是甚至在你的笔记本电脑上。
Olow304/memvid
基于视频的人工智能记忆库。将数百万个文本块存储在MP4文件中,实现闪电般的语义搜索。无需数据库。
leptonai/search_with_lepton
使用 Lepton AI 构建一个快速的基于对话的搜索演示。
intel/ipex-llm
加速在英特尔XPU(例如,带有iGPU和NPU的本地PC,以及Arc、Flex和Max等独立GPU)上的本地大语言模型推理和微调(如LLaMA、Mistral、ChatGLM、Qwen、DeepSeek、Mixtral、Gemma、Phi、MiniCPM、Qwen-VL、MiniCPM-V等),并无缝集成llama.cpp、Ollama、HuggingFace、LangChain、LlamaIndex、vLLM、DeepSpeed、Axolotl等工具。
bentoml/BentoML
最简单的方式来部署AI应用和模型——构建模型推理API、作业队列、大语言模型应用、多模型管道等!
datawhalechina/happy-llm
📚 从零开始的大语言模型原理与实践教程
NirDiamant/agents-towards-production
本仓库提供从头到尾、以代码为主的教程,涵盖生产级别的GenAI代理的每一层,通过经过验证的模式和可重用的蓝图指导你从创意到扩展,适用于实际发布的全流程。
WooooDyy/LLM-Agent-Paper-List
Xi志恒等人撰写的86页论文《基于大型语言模型的代理的兴起与潜力:综述》的论文列表。
TeamWiseFlow/wiseflow
使用大型语言模型(LLMs)从每日海量信息和多种来源中挖掘出你关注的内容。
zilliztech/GPTCache
LLM的语义缓存。完全集成了LangChain和llama_index。
modelscope/agentscope
以更简单的方式开始构建具备LLM能力的多智能体应用。
Upsonic/Upsonic
支持MCP的最可靠AI代理框架。