探索 大语言模型 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
官方 Llama 模型构建指南,涵盖推理、微调、RAG 及端到端应用示例。提供多种集成方案与最新 Llama 4 食谱,适用于文本与视觉模型。
RapidAPI for LLM tools,精选高质量 MCP 服务,支持一键发布与付费。提供 TypeScript SDK 集成,使用 Stripe 按量计费,全球边缘网络加速。
高性能浏览器端LLM推理引擎,基于WebGPU硬件加速,无需服务器支持。完全兼容OpenAI API,支持流式输出、JSON模式和函数调用。内置Llama、Phi、Gemma、Mistral、Qwen等模型,支持自定义模型集成。
开源机器学习工程手册,涵盖大语言模型与多模态模型的训练、微调及推理全流程。提供实用脚本、命令与硬件选型指南,适合工程师快速上手。
一站式从聊天记录创建数字分身。微调 LLM 捕捉独特风格,绑定聊天机器人让数字自我活起来。支持 Telegram 数据源,本地化部署保障隐私。
开源自主 AI 代理框架,专为开发者设计。支持快速构建、管理和运行实用的自主代理。基于 Python,拥有超过 1.7 万星标。
零代码变更即可优化 AI 智能体,支持任何框架(如 LangChain、AutoGen)。通过强化学习、自动提示优化等算法,选择性优化多智能体系统中的一个或多个智能体。
面向 Kubernetes 多云、数据中心和边缘管理的容器平台。提供插件式架构、多集群管理、GitOps DevOps、可观测性及服务网格等功能。
开源 Agent 操作系统,基于 Rust 构建。单二进制文件,14 个 crate,1767+ 测试,零警告。自主代理 24/7 运行,支持 Clip、Lead 等预置 Hands,无需提示即可执行任务。
提供 Google Cloud 上 Gemini、Imagen、Chirp 等生成式 AI 的代码样本与 Jupyter Notebook,涵盖 Vertex AI 平台的多种应用。
优化推理内存,单张 4GB GPU 即可运行 70B 大模型,无需量化、蒸馏或剪枝。现已支持在 8GB VRAM 上运行 405B Llama3.1。
基于 Pydantic 的 GenAI Agent 框架,提供类型安全、模型无关、无缝可观测性和强大的评估功能。支持 MCP、A2A 和 UI 标准,实现人机回圈工具审批和持久化执行。
Python SDK,用于 Agent AI 可观测性、监控与评估。支持 Agent、LLM 和工具追踪,调试多智能体系统,提供自托管仪表板及带时间线和执行图视图的高级分析。
生产级多平台智能机器人开发平台,支持 QQ、微信、Discord、Slack 等即时通信平台,集成 GPT、DeepSeek、Claude 等大模型,提供 Agent、知识库、插件系统与 Web 管理面板,支持 Docker、Kubernetes 等多种部署方式。
端到端语音识别工具包,支持 ASR、VAD、标点恢复、说话人验证等。提供工业级预训练模型,支持推理与微调,涵盖 Paraformer、Whisper 等模型。
个人 AI 助手,易安装、可本地或云端部署。支持多聊天应用,扩展性强。内置定时任务,自定义技能,内存可控。适用于社交、生产力、创意、研究和桌面场景。
开源中英双语对话大模型,基于 GLM 架构,支持 32K 上下文。性能强劲,在 MMLU、CEval 等基准测试中表现优异。推理高效,支持 6G 显存运行,可免费商用。
开源 AI 编程代理,专为大型项目和现实任务设计。基于 Go 开发,支持终端操作,可处理高达 200 万 token 的上下文。提供累积差异审查沙盒,确保变更安全可控。支持 Anthropic、OpenAI、Google 及开源模型组合,实现全自主或精细控制的工作流。
开源智能体编码框架,支持 Paper2Code、Text2Web 和 Text2Backend。基于 Python,利用多智能体系统推进代码生成。
轻量级高性能深度学习框架,支持端侧推理与训练。已集成至阿里内部30+应用,覆盖直播、搜索推荐等70+场景。提供多模态LLM及Diffusion模型的本地部署方案,支持Qwen、LLaMA等主流模型。
⚡️ GenBI 代理,通过自然语言查询任何数据库,秒级生成精准 SQL、图表及 AI 驱动的商业智能。支持语义层、API 嵌入及多种数据源。
开源 LLM 评估框架,类似 Pytest 用于单元测试。支持多种指标,如 G-Eval、RAG 与智能体指标,可本地运行 NLP 模型评估。适用于 RAG、Agent 等应用,帮助优化模型与提示词。