大语言模型资源
探索与 大语言模型 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
internlm/lmdeploy
高性能大语言模型压缩、部署与服务工具包,支持 TurboMind 和 PyTorch 引擎,提供量化、多模态推理及分布式部署能力。
upsonic/upsonic
面向金融科技与银行的生产级 AI Agent 框架,以安全为核心。支持文档分析、客户服务自动化、金融分析与合规监控。提供内置安全引擎、统一 OCR 接口、多智能体协作及工具集成,快速构建可扩展的智能体系统。
zilliztech/deep-searcher
开源深度研究工具,结合 LLM 与向量数据库,基于私有数据进行搜索、评估与推理,提供高精度答案与综合报告。支持多种 LLM 和嵌入模型,具备私有数据搜索、向量数据库管理及文档加载功能。
poloclub/transformer-explainer
交互式可视化工具,在浏览器中运行 GPT-2 模型,实时展示 Transformer 内部组件如何协同工作以预测下一个 token。
paddlepaddle/ernie
ERNIE 4.5 是基于飞桨的多模态大模型家族,包含 10 个变体,支持 MoE 架构与参数共享。ERNIEKit 提供工业级开发工具包,支持 SFT、LoRA 训练及多硬件部署,具备高效训练与推理能力。
mengxi-ream/read-frog
开源沉浸式翻译浏览器扩展,支持多 AI 模型、上下文感知翻译、选区翻译、自定义提示词及字幕翻译等,助力语言学习。
xiangsx/gpt4free-ts
提供免费的 OpenAI GPT-4 API。TypeScript 版本的 xtekky/gpt4free 复现项目,支持多种模型,包括 GPT-4、Claude 等。
sweepai/sweep
Sweep 是 JetBrains 的 AI 编码助手,提供智能代码建议与自动化开发支持。
ekkolearnai/hermes-web-ui
为 Hermes Agent 提供的全功能 Web 仪表板,支持多平台 AI 聊天、会话管理、定时任务与使用分析,基于 TypeScript 构建,界面简洁响应迅速。
evidentlyai/evidently
开源 ML 和 LLM 可观测性框架。评估、测试和监控任何 AI 系统或数据管道。支持表格和文本数据。提供 100+ 内置指标。支持离线评估和实时监控。
nirdiamant/prompt_engineering
提供全面的提示工程教程与实现,涵盖从基础到高级策略。包含 22 个 Jupyter Notebook 实践教程,助力掌握与大语言模型高效交互的技能。
0xplaygrounds/rig
基于 Rust 构建模块化、可扩展的 LLM 应用。支持 20+ 模型提供商统一接口、10+ 向量存储集成,具备完整的 GenAI 语义规范兼容性与 WASM 支持。
tailcallhq/forgecode
AI 增强的终端开发环境,支持 Claude、GPT、O Series 等 300+ 模型。集成代码理解、调试、重构等功能,提供交互式命令行体验。
rayventura/shortgpt
🚀🎬 AI 框架,用于自动化 YouTube Shorts / TikTok 频道内容创作。支持多语言语音合成、视频剪辑、素材获取与字幕生成,基于 Python 构建。
mufeedvh/code2prompt
将代码库转换为单一大语言模型提示词的 CLI 工具。支持源码树、提示词模板和 Token 计数。提供 Rust 核心库、Python SDK 与 MCP 服务器。
quivrhq/megaparse
专为 LLM 设计的无损文档解析器,支持 PDF、Docx、PPTx 等多种格式,提取表格、目录、页眉页脚和图片,确保信息完整。
ericlbuehler/mistral.rs
基于 Rust 的高性能 LLM 推理框架,支持 HuggingFace 模型零配置运行,提供多模态能力、内置 Web UI 及硬件自动调优。支持 GGUF、GPTQ 等多种量化格式,具备连续批处理与 PagedAttention 加速。
apache/hertzbeat
AI 驱动的下一代开源实时可观测性系统。统一指标与日志采集、集中告警分发、智能管理分析。无需 Agent,高性能集群,支持自定义监控与状态页构建。
evermind-ai/everos
构建、评估并集成自进化智能体的长期记忆系统。提供用例、架构方法与基准测试,支持 Python 开发。
internlm/internlm
InternLM 系列开源大模型,涵盖 InternLM、InternLM2、InternLM2.5 和 InternLM3。最新 InternLM3-8B-Instruct 以 4 万亿高质量 token 训练,成本降低超 75%,在推理与知识密集型任务上性能领先,支持深度思考与流畅对话模式。
traceloop/openllmetry
基于 OpenTelemetry 的开源可观测性方案,为 GenAI 或 LLM 应用提供完整追踪能力。支持多种观测平台,如 Datadog、Honeycomb 等。
steel-dev/steel-browser
开源浏览器 API,专为 AI 代理和应用设计。提供完整浏览器控制、会话管理、代理支持、扩展加载和反检测功能。基于 TypeScript,支持 Puppeteer、Playwright 和 Selenium 连接。
ymcui/chinese-llama-alpaca-2
基于 Llama-2 的中文大模型,扩展中文词表并增量预训练,支持 4K/16K/64K 超长上下文,开源基座与指令精调模型,兼容主流 LLM 生态工具。
arcee-ai/mergekit
用于合并预训练大语言模型的工具集。支持多种合并算法,可在 CPU 或低显存 GPU 上运行,支持 Llama、Mistral 等模型。提供 YAML 配置、LoRA 提取、专家混合合并等高级功能。
flyteorg/flyte
基于 Kubernetes 的可扩展工作流编排平台,统一数据、ML 和分析栈。支持 Python SDK 构建生产级管道,实现分布式处理与高效资源利用。
open-compass/opencompass
LLM 评估平台,支持 Llama3、Mistral、InternLM2、GPT-4 等多种模型及 100+ 数据集。提供强大算法与直观界面,助力高效评估 NLP 模型质量与效果。
opennmt/opennmt-py
基于 PyTorch 的开源神经机器翻译与大语言模型框架。支持 NMT、LLM、编码器及模型微调,提供 8/4 位量化与 LoRA 适配器。已推出新项目 Eole 作为替代。
guardrails-ai/guardrails
为大型语言模型添加安全护栏的 Python 框架。通过输入/输出守卫检测并缓解特定风险,支持从 LLM 生成结构化数据。提供丰富的验证器库,可组合成守卫以拦截模型输入输出。
1jehuang/jcode
下一代编码代理框架,支持多会话工作流、无限定制与高性能。基于 Rust 构建,内存占用极低,跨平台运行。
mylxsw/aidea
支持 GPT、通义千问、文心一言等主流大模型及 Stable Diffusion 文生图、图生图、超分辨率、图片上色的全能型 APP,基于 Flutter 开发,代码完全开源。