探索 大语言模型 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
面向 Kubernetes 多云、数据中心和边缘管理的容器平台。提供插件式架构、多集群管理、GitOps DevOps、可观测性及服务网格等功能。
LLM驱动的A/H/美股智能分析器,多数据源行情+实时新闻+Gemini决策仪表盘+多渠道推送,零成本,纯白嫖,定时运行。
一站式从聊天记录创建数字分身。微调 LLM 捕捉独特风格,绑定聊天机器人让数字自我活起来。支持 Telegram 数据源,本地化部署保障隐私。
Python SDK,用于 Agent AI 可观测性、监控与评估。支持 Agent、LLM 和工具追踪,调试多智能体系统,提供自托管仪表板及带时间线和执行图视图的高级分析。
开源中英双语对话大模型,基于 GLM 架构,支持 32K 上下文。性能强劲,在 MMLU、CEval 等基准测试中表现优异。推理高效,支持 6G 显存运行,可免费商用。
生产级多平台智能机器人开发平台,支持 QQ、微信、Discord、Slack 等即时通信平台,集成 GPT、DeepSeek、Claude 等大模型,提供 Agent、知识库、插件系统与 Web 管理面板,支持 Docker、Kubernetes 等多种部署方式。
零代码变更即可优化 AI 智能体,支持任何框架(如 LangChain、AutoGen)。通过强化学习、自动提示优化等算法,选择性优化多智能体系统中的一个或多个智能体。
基于 Pydantic 的 GenAI Agent 框架,提供类型安全、模型无关、无缝可观测性和强大的评估功能。支持 MCP、A2A 和 UI 标准,实现人机回圈工具审批和持久化执行。
端到端语音识别工具包,支持 ASR、VAD、标点恢复、说话人验证等。提供工业级预训练模型,支持推理与微调,涵盖 Paraformer、Whisper 等模型。
开源 AI 编程代理,专为大型项目和现实任务设计。基于 Go 开发,支持终端操作,可处理高达 200 万 token 的上下文。提供累积差异审查沙盒,确保变更安全可控。支持 Anthropic、OpenAI、Google 及开源模型组合,实现全自主或精细控制的工作流。
统一框架,支持 300+ 模型与 RAG 管道,优化本地、私有、安全的企业级应用。支持 GGUF、OpenVINO 等多种推理技术,提供模型目录与知识库管理,可在 AI PC 和边缘设备运行。
开源智能体编码框架,支持 Paper2Code、Text2Web 和 Text2Backend。基于 Python,利用多智能体系统推进代码生成。
Llama中文社区,实时汇总最新Llama学习资料,构建最好的中文Llama大模型开源生态,完全开源可商用。提供模型、算力、数据、论坛等资源,支持Llama2、Llama3、Llama4全系列,涵盖预训练、微调、量化、部署等全流程。
⚡️ GenBI 代理,通过自然语言查询任何数据库,秒级生成精准 SQL、图表及 AI 驱动的商业智能。支持语义层、API 嵌入及多种数据源。
轻量级高性能深度学习框架,支持端侧推理与训练。已集成至阿里内部30+应用,覆盖直播、搜索推荐等70+场景。提供多模态LLM及Diffusion模型的本地部署方案,支持Qwen、LLaMA等主流模型。
汇总可通过 API 访问的免费 LLM 推理资源,包括 OpenRouter、Google AI Studio 等免费供应商,以及提供试用额度的供应商。
收集来自主流 LLM 服务的泄露系统提示,提供可验证来源或可复现提示,支持 PR 提交与 Issues 链接,避免包含敏感商业代码。
开源 ETL 解决方案,将复杂文档转换为语言模型所需的干净结构化数据。支持生产级工作流、分区、丰富、分块和嵌入。
开源 LLM 评估框架,类似 Pytest 用于单元测试。支持多种指标,如 G-Eval、RAG 与智能体指标,可本地运行 NLP 模型评估。适用于 RAG、Agent 等应用,帮助优化模型与提示词。
优化推理内存,单张 4GB GPU 即可运行 70B 大模型,无需量化、蒸馏或剪枝。现已支持在 8GB VRAM 上运行 405B Llama3.1。
专为 LLM 微调、RAG 和评估构建数据集的强大工具。支持 PDF、DOCX 等多种格式文档的智能解析与分割,自动生成高质量 QA 数据集。内置评估系统,支持自动化模型评测与人工盲测,助力垂直领域模型优化。
为 LLM 提供结构化输出,确保生成时即符合指定类型。支持任意模型,集成简单,无需后处理解析。核心功能包括类型安全输出、复杂结构定义及多模型兼容。
开源 MCP 数据库服务器,简化 Gen AI 工具开发。提供连接池、认证等最佳实践,支持端到端可观测性。可将 AI 助手连接至 IDE,实现自然语言查询、自动化管理与上下文感知代码生成。
提供 20+ 高性能大语言模型,支持从零实现、预训练、微调与大规模部署。无抽象层,代码精简,支持 Flash Attention、FSDP、LoRA 等技术,适配多 GPU/TPU 环境。
提供 Google Cloud 上 Gemini、Imagen、Chirp 等生成式 AI 的代码样本与 Jupyter Notebook,涵盖 Vertex AI 平台的多种应用。
开源身份与访问管理 / 单点登录平台,以 Web UI 为核心,支持 OAuth 2.0、OIDC、SAML、CAS、LDAP、SCIM、WebAuthn、TOTP、MFA、Face ID、RADIUS、Google Workspace、Active Directory 和 Kerberos 等协议。