探索 大语言模型 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
通用大语言模型部署引擎,基于 ML 编译技术。支持 AMD、NVIDIA、Apple、Intel 等多平台 GPU,以及 Web、iOS、Android 等环境。提供 OpenAI 兼容 API,通过统一高性能引擎实现跨平台原生部署与优化。
免费、本地、开源的AI助手图形化界面,支持Gemini CLI、Claude Code等多模型。自动检测本地CLI工具,提供统一图形界面,支持远程访问与定时任务。
Git for Data!一个支持 SQL 查询的版本化数据库,提供类似 Git 的分支、合并、推送和拉取功能。兼容 MySQL 协议,可通过 CLI 或 SQL 系统表进行版本控制。
AI 驱动的浏览器自动化框架,结合自然语言与代码控制,提供灵活、可维护且可靠的网页自动化方案。支持 AI 导航与精确代码操作,具备自缓存和自修复能力,可从 AI 驱动过渡到可重复工作流。
构建具有高级记忆的有状态 AI 代理平台,支持本地运行和 API 集成。提供 CLI 工具与 Python/TypeScript SDK,实现 AI 的持续学习与自我改进。
大规模跨任务、语言和模态的自监督预训练框架。涵盖语言、视觉、语音及多模态模型,如 UniLM、BEiT、WavLM 和 Kosmos 系列。包含基础架构研究,如 BitNet、RetNet、LongNet 等新型 Transformer 架构。
基于云原生栈构建多模态 AI 应用。支持 gRPC、HTTP 和 WebSocket 通信,提供高性能服务设计、LLM 流式输出、内置 Docker 集成与 Executor Hub,支持一键部署至 Jina AI Cloud 及 Kubernetes。
强大的 GUI 应用和工具包,用于 Claude Code。创建自定义代理、管理交互式会话、运行安全后台代理、追踪使用成本、管理 MCP 服务器,并提供可视化时间线与检查点功能。
提供从基础到高级的生成式 AI 代理教程与实现,涵盖简单对话机器人到复杂多代理系统,是学习、构建和分享 GenAI 代理的综合资源。
🤗 Datasets 是一个轻量级库,提供两大核心功能:一键加载众多公共数据集,以及高效的数据预处理。支持内存映射、智能缓存和流式模式,可与 NumPy、PyTorch、TensorFlow 等框架无缝集成。
使用 LLM 和计算机视觉自动化浏览器工作流,提供简单 API 端点,替代脆弱的自动化方案。基于视觉理解,无需定制代码即可适应新网站,抗布局变化,支持复杂推理。
通义千问官方仓库,提供 Qwen 系列大语言模型,包括 1.8B、7B、14B、72B 参数的基座与对话模型。支持 Hugging Face、ModelScope、Demo 及 API,已开源。
🤗 PEFT:最先进的参数高效微调库。仅微调少量参数,即可高效适配大模型至下游任务,显著降低计算与存储成本。与 Transformers、Diffusers 和 Accelerate 深度集成,支持 LoRA 等多种方法。
开源企业级智能体平台,支持 RAG 管道、工作流编排和 MCP 工具调用。提供多模态输入输出,兼容各类大模型,可快速集成至第三方系统。
收集微信、淘宝、腾讯、阿里、美团、百度、OpenAI、Google、Facebook、Amazon、eBay 等互联网公司的经典技术架构,按公司和主题分类,欢迎 PR 补充。
本地化 LLM 应用测试工具,支持提示词、智能体与 RAG 评估。提供 AI 红队测试、漏洞扫描与多模型性能对比。通过声明式配置与命令行集成,实现 CI/CD 自动化。
超级全面的深度学习笔记,涵盖CV、NLP、大模型、Agent,基于Pytorch、李沐、吴恩达、大飞课程,提供数据集与交流群。
Kortix 是一个完整的 AI Agent 平台,用于构建、管理和训练自主工作的智能体。支持浏览器自动化、文件管理、数据分析和系统操作,提供可视化工具和 Kortix Super Worker 示例,帮助用户创建定制化 Agent 以处理复杂任务。
提供构建可靠 LLM 应用的 12 项原则,旨在打造适合生产环境的 AI 代理。项目基于 TypeScript,包含详细指南和社区讨论。
汇总可通过 API 访问的免费 LLM 推理资源,包括 OpenRouter、Google AI Studio 等免费供应商,以及提供试用额度的供应商。
开源、代码优先的 Python 工具包,用于构建、评估和部署复杂 AI 智能体。支持灵活编排、多智能体系统,可部署于 Cloud Run 或 Vertex AI。提供丰富工具生态和 Agent Config 功能。
基于大语言模型的自动化工具,可修复 GitHub 问题、进行网络安全攻防或编程挑战。支持配置 YAML 文件,由普林斯顿和斯坦福大学研究团队开发。
开源中文LLaMA与Alpaca大语言模型,扩展中文词表并基于中文数据预训练与指令精调。支持本地CPU/GPU量化部署,兼容transformers、llama.cpp等生态,提供7B/13B/33B等多版本模型。
开源教程库,提供端到端、代码优先的 GenAI 代理生产级教程。涵盖状态工作流、向量记忆、实时搜索、Docker 部署、FastAPI、安全护栏、GPU 扩展、浏览器自动化、微调、多代理协调、可观测性、评估和 UI 开发,从原型到企业级部署。
Tongyi DeepResearch 是阿里云推出的开源深度研究智能体,具备 305 亿参数,每 token 仅激活 33 亿参数。专为长周期、深度信息检索任务设计,在多个智能体搜索基准测试中表现领先。
AI 原生数据应用开发框架,集成 AWEL 智能体工作流表达语言与多智能体协作。支持 RAG、GBI、微调及数据驱动自进化,简化大模型应用开发。