大语言模型资源
探索与 大语言模型 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
hqwu-hitcs/awesome-chinese-llm
整理开源中文大语言模型,聚焦小规模、可私有化部署、低成本训练的模型,涵盖底座、垂直领域微调、应用、数据集与教程等资源。
mlc-ai/mlc-llm
通用大语言模型部署引擎,基于 ML 编译技术。支持 AMD、NVIDIA、Apple、Intel 等多平台 GPU,以及 Web、iOS、Android 等环境。提供 OpenAI 兼容 API,通过统一高性能引擎实现跨平台原生部署与优化。
iofficeai/aionui
免费、本地、开源的AI助手图形化界面,支持Gemini CLI、Claude Code等多模型。自动检测本地CLI工具,提供统一图形界面,支持远程访问与定时任务。
dolthub/dolt
Git for Data!一个支持 SQL 查询的版本化数据库,提供类似 Git 的分支、合并、推送和拉取功能。兼容 MySQL 协议,可通过 CLI 或 SQL 系统表进行版本控制。
browserbase/stagehand
AI 驱动的浏览器自动化框架,结合自然语言与代码控制,提供灵活、可维护且可靠的网页自动化方案。支持 AI 导航与精确代码操作,具备自缓存和自修复能力,可从 AI 驱动过渡到可重复工作流。
letta-ai/letta
构建具有高级记忆的有状态 AI 代理平台,支持本地运行和 API 集成。提供 CLI 工具与 Python/TypeScript SDK,实现 AI 的持续学习与自我改进。
microsoft/unilm
大规模跨任务、语言和模态的自监督预训练框架。涵盖语言、视觉、语音及多模态模型,如 UniLM、BEiT、WavLM 和 Kosmos 系列。包含基础架构研究,如 BitNet、RetNet、LongNet 等新型 Transformer 架构。
jina-ai/serve
基于云原生栈构建多模态 AI 应用。支持 gRPC、HTTP 和 WebSocket 通信,提供高性能服务设计、LLM 流式输出、内置 Docker 集成与 Executor Hub,支持一键部署至 Jina AI Cloud 及 Kubernetes。
winfunc/opcode
强大的 GUI 应用和工具包,用于 Claude Code。创建自定义代理、管理交互式会话、运行安全后台代理、追踪使用成本、管理 MCP 服务器,并提供可视化时间线与检查点功能。
nirdiamant/genai_agents
提供从基础到高级的生成式 AI 代理教程与实现,涵盖简单对话机器人到复杂多代理系统,是学习、构建和分享 GenAI 代理的综合资源。
huggingface/datasets
🤗 Datasets 是一个轻量级库,提供两大核心功能:一键加载众多公共数据集,以及高效的数据预处理。支持内存映射、智能缓存和流式模式,可与 NumPy、PyTorch、TensorFlow 等框架无缝集成。
skyvern-ai/skyvern
使用 LLM 和计算机视觉自动化浏览器工作流,提供简单 API 端点,替代脆弱的自动化方案。基于视觉理解,无需定制代码即可适应新网站,抗布局变化,支持复杂推理。
qwenlm/qwen
通义千问官方仓库,提供 Qwen 系列大语言模型,包括 1.8B、7B、14B、72B 参数的基座与对话模型。支持 Hugging Face、ModelScope、Demo 及 API,已开源。
huggingface/peft
🤗 PEFT:最先进的参数高效微调库。仅微调少量参数,即可高效适配大模型至下游任务,显著降低计算与存储成本。与 Transformers、Diffusers 和 Accelerate 深度集成,支持 LoRA 等多种方法。
1panel-dev/maxkb
开源企业级智能体平台,支持 RAG 管道、工作流编排和 MCP 工具调用。提供多模态输入输出,兼容各类大模型,可快速集成至第三方系统。
davideuler/architecture.of.internet-product
收集微信、淘宝、腾讯、阿里、美团、百度、OpenAI、Google、Facebook、Amazon、eBay 等互联网公司的经典技术架构,按公司和主题分类,欢迎 PR 补充。
promptfoo/promptfoo
本地化 LLM 应用测试工具,支持提示词、智能体与 RAG 评估。提供 AI 红队测试、漏洞扫描与多模型性能对比。通过声明式配置与命令行集成,实现 CI/CD 自动化。
accumulatemore/cv
超级全面的深度学习笔记,涵盖CV、NLP、大模型、Agent,基于Pytorch、李沐、吴恩达、大飞课程,提供数据集与交流群。
dyad-sh/dyad
本地开源 AI 应用构建器,快速、私密、完全自主控制。支持自定义 API 密钥,跨平台运行,无需注册即可下载使用。
p-e-w/heretic
完全自动移除语言模型的审查机制。结合方向消融与 TPE 优化器,无需人工干预即可生成高质量去审查模型,同时最大程度保留原模型智能。
kortix-ai/suna
Kortix 是一个完整的 AI Agent 平台,用于构建、管理和训练自主工作的智能体。支持浏览器自动化、文件管理、数据分析和系统操作,提供可视化工具和 Kortix Super Worker 示例,帮助用户创建定制化 Agent 以处理复杂任务。
humanlayer/12-factor-agents
提供构建可靠 LLM 应用的 12 项原则,旨在打造适合生产环境的 AI 代理。项目基于 TypeScript,包含详细指南和社区讨论。
cheahjs/free-llm-api-resources
汇总可通过 API 访问的免费 LLM 推理资源,包括 OpenRouter、Google AI Studio 等免费供应商,以及提供试用额度的供应商。
google/adk-python
开源、代码优先的 Python 工具包,用于构建、评估和部署复杂 AI 智能体。支持灵活编排、多智能体系统,可部署于 Cloud Run 或 Vertex AI。提供丰富工具生态和 Agent Config 功能。
swe-agent/swe-agent
基于大语言模型的自动化工具,可修复 GitHub 问题、进行网络安全攻防或编程挑战。支持配置 YAML 文件,由普林斯顿和斯坦福大学研究团队开发。
comet-ml/opik
开源 AI 可观测性平台,提供全面追踪、自动评估和生产就绪仪表板,用于调试、评估和监控 LLM 应用、RAG 系统及智能体工作流。
ymcui/chinese-llama-alpaca
开源中文LLaMA与Alpaca大语言模型,扩展中文词表并基于中文数据预训练与指令精调。支持本地CPU/GPU量化部署,兼容transformers、llama.cpp等生态,提供7B/13B/33B等多版本模型。
nirdiamant/agents-towards-production
开源教程库,提供端到端、代码优先的 GenAI 代理生产级教程。涵盖状态工作流、向量记忆、实时搜索、Docker 部署、FastAPI、安全护栏、GPU 扩展、浏览器自动化、微调、多代理协调、可观测性、评估和 UI 开发,从原型到企业级部署。
alibaba-nlp/deepresearch
Tongyi DeepResearch 是阿里云推出的开源深度研究智能体,具备 305 亿参数,每 token 仅激活 33 亿参数。专为长周期、深度信息检索任务设计,在多个智能体搜索基准测试中表现领先。
eosphoros-ai/db-gpt
AI 原生数据应用开发框架,集成 AWEL 智能体工作流表达语言与多智能体协作。支持 RAG、GBI、微调及数据驱动自进化,简化大模型应用开发。