探索 大语言模型 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
开放代理计算机,适用于任何数字工作。基于 TypeScript 构建,支持 macOS,Windows 和 Linux 开发中。提供共享环境,人类与 AI 代理协作,记忆连续,工作状态不丢失。
结合知识库管理的多租户 Agent Harness 平台。集成 LightRAG 知识库与知识图谱,基于 LangChain + Vue + FastAPI 构建,支持 DeepAgents、MinerU PDF、Neo4j、MCP。
社区维护的 AI 助手技能库,提供即用型文本技能文件。支持 Claude、Copilot 等主流 AI 平台,无需重训即可动态加载技能。通过 SkillsMP 市场或 CLI 工具快速发现和管理技能。
提供 Chronos 系列预训练时间序列预测模型接口,支持零样本单/多变量及协变量预测。Chronos-2 性能领先,Chronos-Bolt 速度提升 250 倍,内存效率更高。支持 Hugging Face 模型与 SageMaker 部署。
一个统一的 AI 平台,从管道到智能体。支持任何 Python 逻辑,自动容器化、追踪运行、抽象基础设施复杂性,并集成 MLflow、Langgraph 等工具,助力快速迭代实验。
开源评估与测试库,用于 LLM 代理。自动检测 AI 应用中的性能、偏见和安全问题,支持 RAG 评估工具包 (RAGET) 生成测试集并评估各组件,兼容多种模型与环境。
lakeFS 是开源数据湖版本控制工具,提供类 Git 的数据管理能力。支持 AWS S3、Azure Blob Storage 和 Google Cloud Storage,兼容 S3 API,可与 Spark、Hive 等框架无缝集成。实现可重复、原子性的数据湖操作,适用于 ETL 测试、数据科学和分析。
开源 AI 原生应用开发平台。统一集成数百种 LLM 模型,提供工具、RAG、助手等模块的直观管理。支持异步高性能计算与一键部署,助力高效构建可扩展的 AI Agent。
⚡ 无 Python 依赖的 Rust 推理服务器,兼容 OpenAI API。支持 GGUF + SafeTensors,热模型切换,自动发现,单二进制文件。免费且永久免费。
开源 LLM 资产管理平台,提供统一管理、微服务架构与企业级安全。支持私有化部署,兼容 Hugging Face SDK,助力高效处理模型、数据集及应用。
为 AI 代理提供通用记忆层,支持可扩展、可扩展和可互操作的记忆存储与检索,实现下一代自主系统的状态管理。主要语言 Python。
高性能 LLM 推理 API 与聊天界面,融合 DeepSeek R1 的链式思考推理与 Anthropic Claude 的创意代码生成能力。基于 Rust 构建,提供零延迟流式响应、私有安全的 BYOK API 管理,并支持高度可配置与开源部署。
专为移动设备与可穿戴设备打造的低延迟 AI 引擎。支持 ARM CPU 最快推理,零拷贝内存映射实现 10 倍 RAM 节省,多模态 SDK 覆盖语音、视觉与语言模型,支持云回退与 NPU 加速。
将统计格式转换为可编辑内容。基于 SAM 3 和多模态大模型,实现高保真重建,保留原始图表细节与逻辑关系。支持一键生成可编辑的 DrawIO (XML) 文件。
端到端框架,用于构建自定义 AI 应用和智能体。支持多种数据库后端,如 MongoDB、SQL、Snowflake 和 Redis。基于 Python,提供插件化架构,便于集成现有工具。
精选 LLM/VLM 推理论文与代码库,涵盖 Flash-Attention、Paged-Attention、WINT8/4、并行化等技术。提供 PDF 下载与分类索引。
VS Code 扩展,自主编码代理。将想法转化为代码,支持网站、仪表盘、服务器开发。提供调试、部署、网络搜索功能,适合各水平开发者。加速开发流程,让编码更高效。
AI 驱动的 ComfyUI 智能助手,提供工作流生成、一键调试与优化,支持 Agent 架构升级,提升创作效率。
自托管 AI 代理编排平台,调度任务、运行多代理工作流、监控成本、统一管理。基于 SQLite,零外部依赖,支持实时更新与角色访问控制。
跨平台桌面 AI 助手与 MCP 客户端。兼容主流服务提供商,支持通过 MCP 服务器接入本地知识库与工具。基于 TypeScript 构建,提供文件系统访问、数据库交互等扩展能力。
原生 Android LLM 聊天客户端,支持多模型提供商切换,具备 Material You 设计、多模态输入、网络访问及 MCP 等功能。
⚡️ 下一代个人 AI 助手,基于 LLM、RAG 和智能体循环,支持计算机使用、浏览器使用和编码智能体。单二进制文件,无需安装。
非官方 Python 包,通过 Cookie 值调用 Google Bard API。适用于无法通过官方认证的用户。项目已停止维护,建议转向 Gemini API。
企业级 RPA 桌面应用,支持低代码/无代码可视化流程设计。提供 300+ 原子组件,覆盖 Windows 桌面与网页自动化。深度集成 Astron Agent,实现自动化与智能体双向调用。支持 Docker 部署,具备企业级安全与协作能力。
开源程序合成模型家族,由 Salesforce AI Research 开发。包含 CodeGen1 和 CodeGen2 系列,参数规模从 350M 到 16B,性能媲美 OpenAI Codex。提供多版本模型,支持 Hugging Face Hub 调用。
基于 ML、LLM 和 Vision LLM 实现结构化数据提取与指令调用。支持多格式文档处理、可插拔架构、多种后端(MLX、Ollama、vLLM、Hugging Face)及 RESTful API。提供交互式 Web 界面,支持拖拽上传与实时处理。
基于 TypeScript 的声明式信息图渲染框架,支持 AI 友好语法、流式渲染与内置编辑器,提供约 200 个模板,快速生成高质量 SVG 信息图。
新一代超大规模 MoE 模型训练引擎。支持无丢弃训练、长序列支持及卓越效率,训练规模可达 1T 参数。优化 Ascend NPU,兼容 GPU 与 NPU 硬件。