探索 大语言模型 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
优化推理内存,单张 4GB GPU 即可运行 70B 大模型,无需量化、蒸馏或剪枝。现已支持在 8GB VRAM 上运行 405B Llama3.1。
基于大语言模型的自动化工具,可修复 GitHub 问题、进行网络安全攻防或编程挑战。支持配置 YAML 文件,由普林斯顿和斯坦福大学研究团队开发。
Tongyi DeepResearch 是阿里云推出的开源深度研究智能体,具备 305 亿参数,每 token 仅激活 33 亿参数。专为长周期、深度信息检索任务设计,在多个智能体搜索基准测试中表现领先。
AI 原生数据应用开发框架,集成 AWEL 智能体工作流表达语言与多智能体协作。支持 RAG、GBI、微调及数据驱动自进化,简化大模型应用开发。
开源中文LLaMA与Alpaca大语言模型,扩展中文词表并基于中文数据预训练与指令精调。支持本地CPU/GPU量化部署,兼容transformers、llama.cpp等生态,提供7B/13B/33B等多版本模型。
官方 Llama 模型构建指南,涵盖推理、微调、RAG 及端到端应用示例。提供多种集成方案与最新 Llama 4 食谱,适用于文本与视觉模型。
构建代码知识图谱,为 Claude Code 提供持久化代码库地图,减少 6.8 倍审查令牌和 49 倍日常编码令牌。基于 Tree-sitter 解析,支持增量更新和 MCP 集成,实现精准上下文读取。
高性能浏览器端LLM推理引擎,基于WebGPU硬件加速,无需服务器支持。完全兼容OpenAI API,支持流式输出、JSON模式和函数调用。内置Llama、Phi、Gemma、Mistral、Qwen等模型,支持自定义模型集成。
RapidAPI for LLM tools,精选高质量 MCP 服务,支持一键发布与付费。提供 TypeScript SDK 集成,使用 Stripe 按量计费,全球边缘网络加速。
开源机器学习工程手册,涵盖大语言模型与多模态模型的训练、微调及推理全流程。提供实用脚本、命令与硬件选型指南,适合工程师快速上手。
一站式从聊天记录创建数字分身。微调 LLM 捕捉独特风格,绑定聊天机器人让数字自我活起来。支持 Telegram 数据源,本地化部署保障隐私。
开源 Agent 操作系统,基于 Rust 构建。单二进制文件,14 个 crate,1767+ 测试,零警告。自主代理 24/7 运行,支持 Clip、Lead 等预置 Hands,无需提示即可执行任务。
端到端语音识别工具包,支持 ASR、VAD、标点恢复、说话人验证等。提供工业级预训练模型,支持推理与微调,涵盖 Paraformer、Whisper 等模型。
基于 Pydantic 的 GenAI Agent 框架,提供类型安全、模型无关、无缝可观测性和强大的评估功能。支持 MCP、A2A 和 UI 标准,实现人机回圈工具审批和持久化执行。
开源自主 AI 代理框架,专为开发者设计。支持快速构建、管理和运行实用的自主代理。基于 Python,拥有超过 1.7 万星标。
个人 AI 助手,易安装、可本地或云端部署。支持多聊天应用,扩展性强。内置定时任务,自定义技能,内存可控。适用于社交、生产力、创意、研究和桌面场景。
零代码变更即可优化 AI 智能体,支持任何框架(如 LangChain、AutoGen)。通过强化学习、自动提示优化等算法,选择性优化多智能体系统中的一个或多个智能体。
无限免费 AI 编程。连接 Claude Code、Cursor 等工具至 40+ 免费 AI 提供商。自动回退,RTK 节省 20-40% 令牌,永不限流。
提供 Google Cloud 上 Gemini、Imagen、Chirp 等生成式 AI 的代码样本与 Jupyter Notebook,涵盖 Vertex AI 平台的多种应用。
面向 Kubernetes 多云、数据中心和边缘管理的容器平台。提供插件式架构、多集群管理、GitOps DevOps、可观测性及服务网格等功能。
面向初学者的现代编程课程,通过交互式教程和可视化学习,帮助用户逐步掌握 vibe coding,实现从零到应用的构建。
生产级多平台智能机器人开发平台,支持 QQ、微信、Discord、Slack 等即时通信平台,集成 GPT、DeepSeek、Claude 等大模型,提供 Agent、知识库、插件系统与 Web 管理面板,支持 Docker、Kubernetes 等多种部署方式。
Python SDK,用于 Agent AI 可观测性、监控与评估。支持 Agent、LLM 和工具追踪,调试多智能体系统,提供自托管仪表板及带时间线和执行图视图的高级分析。