大语言模型资源
探索与 大语言模型 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
nvidia/garak
LLM 漏洞扫描工具,用于检测生成式 AI 的幻觉、数据泄露、提示注入、误导信息、毒性生成及越狱等弱点。支持多种 LLM 接口,如 Hugging Face、OpenAI、AWS Bedrock 等。
internlm/internlm
InternLM 系列开源大模型,涵盖 InternLM、InternLM2、InternLM2.5 和 InternLM3。最新 InternLM3-8B-Instruct 以 4 万亿高质量 token 训练,成本降低超 75%,在推理与知识密集型任务上性能领先,支持深度思考与流畅对话模式。
rayventura/shortgpt
🚀🎬 AI 框架,用于自动化 YouTube Shorts / TikTok 频道内容创作。支持多语言语音合成、视频剪辑、素材获取与字幕生成,基于 Python 构建。
apache/hertzbeat
AI 驱动的下一代开源实时可观测性系统。统一指标与日志采集、集中告警分发、智能管理分析。无需 Agent,高性能集群,支持自定义监控与状态页构建。
google/adk-go
开源、代码优先的 Go 工具包,用于构建、评估和部署复杂 AI 智能体。具备模块化、多智能体系统、云原生部署能力,支持灵活控制与高并发。
opennmt/opennmt-py
基于 PyTorch 的开源神经机器翻译与大语言模型框架。支持 NMT、LLM、编码器及模型微调,提供 8/4 位量化与 LoRA 适配器。已推出新项目 Eole 作为替代。
vladmandic/sdnext
全功能 WebUI,支持 AI 生成图像与视频、字幕及处理。多平台兼容,包括 nVidia CUDA、AMD ROCm、Intel Arc、DirectML、OpenVINO 等。内置模型编译与量化优化,支持 150+ OpenCLiP 和 20+ VLM 模型进行交互/字幕处理。
mylxsw/aidea
支持 GPT、通义千问、文心一言等主流大模型及 Stable Diffusion 文生图、图生图、超分辨率、图片上色的全能型 APP,基于 Flutter 开发,代码完全开源。
hijkzzz/awesome-llm-strawberry
汇集 OpenAI o1 🍓 及推理技术相关的论文、博客与项目,持续追踪 LLM 推理前沿进展。
traceloop/openllmetry
基于 OpenTelemetry 的开源可观测性方案,为 GenAI 或 LLM 应用提供完整追踪能力。支持多种观测平台,如 Datadog、Honeycomb 等。
poloclub/transformer-explainer
交互式可视化工具,在浏览器中运行 GPT-2 模型,实时展示 Transformer 内部组件如何协同工作以预测下一个 token。
arcee-ai/mergekit
用于合并预训练大语言模型的工具集。支持多种合并算法,可在 CPU 或低显存 GPU 上运行,支持 Llama、Mistral 等模型。提供 YAML 配置、LoRA 提取、专家混合合并等高级功能。
amitness/learning
个人学习日志,记录构建核心软件工程技能及拓展相邻技术的过程。当前焦点:生成式 AI。包含系统设计、数学、数据结构与算法、数据建模等领域的学习资源与进度追踪。
yihong0618/xiaogpt
通过小米 AI 音箱使用 ChatGPT 及其他大语言模型。支持多种 AI 类型,如 ChatGPT、New Bing、ChatGLM、Gemini 等。提供命令行工具,可配置 API 密钥,实现语音交互与 TTS 回答。
internlm/mindsearch
基于 LLM 的多智能体网络搜索引擎框架,模仿人类思维进行深度搜索,支持多种搜索 API 和前端界面。
flyteorg/flyte
基于 Kubernetes 的可扩展工作流编排平台,统一数据、ML 和分析栈。支持 Python SDK 构建生产级管道,实现分布式处理与高效资源利用。
postgresml/postgresml
Postgres with GPUs for ML/AI apps. 在数据库内运行机器学习与AI,支持GPU加速、LLMs、RAG管道和向量搜索。提供47+算法,性能提升8-40倍,无缝集成PostgreSQL生态。
open-compass/opencompass
LLM 评估平台,支持 Llama3、Mistral、InternLM2、GPT-4 等多种模型及 100+ 数据集。提供强大算法与直观界面,助力高效评估 NLP 模型质量与效果。
coplaydev/unity-mcp
作为桥梁,让 AI 助手(如 Claude、Cursor)通过本地 MCP 客户端直接与 Unity 编辑器交互。提供工具管理资产、控制场景、编辑脚本和自动化任务,支持 C# 语言。
ericlbuehler/mistral.rs
基于 Rust 的高性能 LLM 推理框架,支持 HuggingFace 模型零配置运行,提供多模态能力、内置 Web UI 及硬件自动调优。支持 GGUF、GPTQ 等多种量化格式,具备连续批处理与 PagedAttention 加速。
yangjianxin1/firefly
一站式大模型训练工具,支持预训练、指令微调和DPO。兼容Qwen2.5、Llama3、Gemma等主流模型,提供全量、LoRA、QLoRA高效训练方案。集成Unsloth加速,节省显存与时间。开源数据集与模型权重。
julep-ai/julep
开源平台,用于构建可扩展的无服务器 AI 工作流。提供持久记忆、模块化流程、工具编排和并行执行,无需管理基础设施。
iflytek/astron-rpa
企业级 RPA 桌面应用,支持低代码/无代码可视化流程设计。提供 300+ 原子组件,覆盖 Windows 桌面与网页自动化。深度集成 Astron Agent,实现自动化与智能体双向调用。支持 Docker 部署,具备企业级安全与协作能力。
tencentqqgylab/appagent
基于 LLM 的多模态智能体框架,用于操作智能手机应用。通过简化动作空间模仿人类交互,如点击和滑动,无需系统后端访问。支持通过自主探索或观察人类演示学习新应用,生成知识库以执行跨应用复杂任务。
steel-dev/steel-browser
开源浏览器 API,专为 AI 代理和应用设计。提供完整浏览器控制、会话管理、代理支持、扩展加载和反检测功能。基于 TypeScript,支持 Puppeteer、Playwright 和 Selenium 连接。
run-llama/rags
通过自然语言构建基于数据的 ChatGPT。支持描述任务、配置参数并查询 RAG 代理。支持 OpenAI、Anthropic 等 LLM 和嵌入模型。
guardrails-ai/guardrails
为大型语言模型添加安全护栏的 Python 框架。通过输入/输出守卫检测并缓解特定风险,支持从 LLM 生成结构化数据。提供丰富的验证器库,可组合成守卫以拦截模型输入输出。
voltagent/voltagent
基于开源TypeScript框架的AI智能体工程平台,提供内存、RAG、工具、MCP、语音、工作流等核心功能。支持多智能体协同与监督者模式,兼容多种LLM提供商,具备可观测性、部署和评估能力。
fr0gger/awesome-gpt-agents
精选网络安全 GPT 智能体列表,涵盖攻防、漏洞分析、代码审计等场景,提供社区贡献与实用指南。
superagent-ai/superagent
开源 SDK,保护 AI 应用免受提示注入、数据泄露和有害输出。提供运行时防护、PII 脱敏、仓库扫描及红队测试,支持 TypeScript 和 Python,低延迟且可本地部署。