探索 大语言模型 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
通过编译时转换,提供超快速的运行时验证器和序列化器。支持 JSON schema、LLM 函数调用 schema、Protocol Buffer 编解码及随机数据生成。仅需一行纯 TypeScript 类型,性能远超 class-validator 和 class-transformer。
开源 LLM 可观测性平台与 AI 网关。一行代码集成,支持 100+ 模型,提供追踪、监控、评估和实验功能。包含成本与延迟追踪、代理追踪、自动回退及提示管理。支持自托管,提供免费套餐。
将 PostgreSQL 转变为 RAG 和智能体应用的生产级检索引擎。自动创建并同步向量嵌入,支持语义目录实现自然语言转 SQL。兼容 pgvector,提供开箱即用的批处理与容错机制。
⚡️ 社区维护的 PHP API 客户端,用于与 OpenAI API 交互。支持 PHP 8.2+,通过 Composer 安装,提供完整的 API 资源覆盖,包括模型、聊天、音频、嵌入等。
开源、精准、易用的视频语音识别与剪辑工具,集成 LLM AI 剪辑功能。基于 FunASR Paraformer 模型,支持热词定制、说话人识别及多段自由剪辑,自动生成 SRT 字幕。
开源纯文本笔记与待办管理器,支持 Markdown,可与 Nextcloud/ownCloud 同步,适用于 Linux、macOS 和 Windows。
高性能 GPU 内核库,服务于大语言模型推理。提供统一 API,支持注意力、GEMM、MoE 等操作,具备多种后端实现。优化预填充、解码与混合批处理场景,支持 FP8/FP4 低精度计算与现代 GPU 架构。
AI Agent 开发指南 | LangGraph 实战 | 高级 RAG | 转行大模型 | 大模型面试 | 算法工程师 | 面试题库 | 强化学习 | 数据合成。系统化 + 求职导向 + 实战验证,提供从入门到拿 Offer 的完整路径。
MCP 集成平台,让 AI 代理在任何规模下可靠使用工具。提供智能连接器 Strata、100+ 预构建集成及可扩展的 MCP 沙盒环境,支持 LLM 训练与强化学习。
视觉化智能体工作流开发平台,加速迭代 10 倍。支持 Python 代码或 UI 构建,内置测试、调试、部署功能。提供人机回环、循环、RAG、多模态处理等核心特性,兼容 100+ LLM 供应商。
基于 Apple Intelligence 的免费 AI 工具,提供 CLI、OpenAI 兼容服务器和交互式聊天。100% 本地运行,无需 API 密钥或云端。
基于 MLX 的 Python 包,用于在 Apple 芯片上运行和微调大语言模型。支持 Hugging Face Hub 集成、模型量化、LoRA 微调及分布式推理。提供命令行和 Python API,便于文本生成与聊天。
为 Claude Code 和 Cursor 等 AI 代理提供工作规则与知识库,提升协作效率。此为旧项目,新工作已迁移至 agent-scripts。
开源可商用的70亿参数双语预训练模型,基于Transformer架构,在1.2万亿token上训练,支持4096上下文窗口。在C-Eval、MMLU等中英文基准测试中表现优异。
高性能企业级 AI 网关,支持 1000+ 模型,50x 优于 LiteLLM,自适应负载均衡、集群模式、防护机制,5k RPS 下延迟 <100 µs。
基于 G4F API 的免费 GPT 3.5/4 聊天 WebUI,无需 API 密钥。提供用户友好的界面和增强的越狱功能。
Python SDK,用于 AI 智能体监控、LLM 成本追踪与基准测试。原生集成 CrewAI、OpenAI Agents SDK、LangChain 等主流框架,支持自托管,助力从原型到生产的全流程开发。
提供稳健的对齐配方,用于继续预训练和使语言模型与人类及 AI 偏好对齐。包含训练脚本、复现模型的配方,以及 DPO、ORPO 等对齐方法的实现。
AI 驱动的视频切片与高光生成工具,支持 YouTube / B 站下载、自动切片、智能合集生成。基于 Python + FastAPI + React 技术栈,提供 Web 界面与异步处理。
基于 MCP 架构的低代码 RAG 框架,通过 YAML 配置实现复杂流程编排。提供可视化 IDE,支持管道构建与代码编辑双向同步,内置 AI 助手辅助开发。
精选高质量中文预训练模型、大语言模型及多模态模型集合,涵盖 NLU、NLG、多模态等系列,持续更新,提供 HuggingFace 镜像下载推荐。
基于 Kubernetes 的标准化分布式生成式与预测式 AI 推理平台,支持多框架部署。提供 LLM 优化、GPU 加速、模型缓存、KV 缓存卸载、自动扩缩容等生成式 AI 功能,以及多框架支持、智能路由、高级部署、模型可解释性、高级监控等预测式 AI 功能。
基于 KVCache 的 LLM 服务解耦架构,为 Kimi 提供高性能推理平台,支持 Transfer Engine 和 Mooncake Store 开源。
多模型协作开发系统,Claude 编排 + Codex 后端 + Gemini 前端,28 个命令覆盖全流程,一键安装零配置,安全设计无写权限。
下一代 AI Agent 优化平台,提供开发、调试、评估到监控的全生命周期管理,支持 Prompt 开发、系统评估与可观测性,助力高效构建与运营 AI Agent。