大语言模型资源
探索与 大语言模型 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
flyteorg/flyte
基于 Kubernetes 的可扩展工作流编排平台,统一数据、ML 和分析栈。支持 Python SDK 构建生产级管道,实现分布式处理与高效资源利用。
mylxsw/aidea
支持 GPT、通义千问、文心一言等主流大模型及 Stable Diffusion 文生图、图生图、超分辨率、图片上色的全能型 APP,基于 Flutter 开发,代码完全开源。
cocoindex-io/cocoindex
基于 Rust 的高性能 AI 数据转换框架,支持增量处理和数据血缘。以声明式数据流编程,仅需约 100 行 Python 代码即可定义转换,实现源数据与目标的自动同步。
open-compass/opencompass
LLM 评估平台,支持 Llama3、Mistral、InternLM2、GPT-4 等多种模型及 100+ 数据集。提供强大算法与直观界面,助力高效评估 NLP 模型质量与效果。
hijkzzz/awesome-llm-strawberry
汇集 OpenAI o1 🍓 及推理技术相关的论文、博客与项目,持续追踪 LLM 推理前沿进展。
steel-dev/steel-browser
开源浏览器 API,专为 AI 代理和应用设计。提供完整浏览器控制、会话管理、代理支持、扩展加载和反检测功能。基于 TypeScript,支持 Puppeteer、Playwright 和 Selenium 连接。
internlm/mindsearch
基于 LLM 的多智能体网络搜索引擎框架,模仿人类思维进行深度搜索,支持多种搜索 API 和前端界面。
amitness/learning
个人学习日志,记录构建核心软件工程技能及拓展相邻技术的过程。当前焦点:生成式 AI。包含系统设计、数学、数据结构与算法、数据建模等领域的学习资源与进度追踪。
yihong0618/xiaogpt
通过小米 AI 音箱使用 ChatGPT 及其他大语言模型。支持多种 AI 类型,如 ChatGPT、New Bing、ChatGLM、Gemini 等。提供命令行工具,可配置 API 密钥,实现语音交互与 TTS 回答。
tailcallhq/forgecode
AI 增强的终端开发环境,支持 Claude、GPT、O Series 等 300+ 模型。集成代码理解、调试、重构等功能,提供交互式命令行体验。
postgresml/postgresml
Postgres with GPUs for ML/AI apps. 在数据库内运行机器学习与AI,支持GPU加速、LLMs、RAG管道和向量搜索。提供47+算法,性能提升8-40倍,无缝集成PostgreSQL生态。
guardrails-ai/guardrails
为大型语言模型添加安全护栏的 Python 框架。通过输入/输出守卫检测并缓解特定风险,支持从 LLM 生成结构化数据。提供丰富的验证器库,可组合成守卫以拦截模型输入输出。
tencentqqgylab/appagent
基于 LLM 的多模态智能体框架,用于操作智能手机应用。通过简化动作空间模仿人类交互,如点击和滑动,无需系统后端访问。支持通过自主探索或观察人类演示学习新应用,生成知识库以执行跨应用复杂任务。
grab/cursor-talk-to-figma-mcp
Cursor 与 Figma 的 MCP 集成,允许 Cursor Agentic AI 读取设计并以编程方式修改。支持批量文本替换和实例覆盖传播等自动化功能。
yangjianxin1/firefly
一站式大模型训练工具,支持预训练、指令微调和DPO。兼容Qwen2.5、Llama3、Gemma等主流模型,提供全量、LoRA、QLoRA高效训练方案。集成Unsloth加速,节省显存与时间。开源数据集与模型权重。
julep-ai/julep
开源平台,用于构建可扩展的无服务器 AI 工作流。提供持久记忆、模块化流程、工具编排和并行执行,无需管理基础设施。
superagent-ai/superagent
开源 SDK,保护 AI 应用免受提示注入、数据泄露和有害输出。提供运行时防护、PII 脱敏、仓库扫描及红队测试,支持 TypeScript 和 Python,低延迟且可本地部署。
run-llama/rags
通过自然语言构建基于数据的 ChatGPT。支持描述任务、配置参数并查询 RAG 代理。支持 OpenAI、Anthropic 等 LLM 和嵌入模型。
fr0gger/awesome-gpt-agents
精选网络安全 GPT 智能体列表,涵盖攻防、漏洞分析、代码审计等场景,提供社区贡献与实用指南。
olimorris/codecompanion.nvim
Neovim 中的 AI 编程助手,支持多种 LLM 和 Agent 协议,提供内联转换、代码创建和重构功能。
datawhalechina/all-in-rag
RAG 技术全栈指南,涵盖从理论到实践的完整学习路径,包括数据处理、索引构建、检索技术与项目实战,支持多模态检索。
haifengl/smile
基于 Java 的统计机器智能与学习引擎,提供全面的机器学习算法,包括深度学习、LLM、分类、回归、聚类、特征选择、流形学习等。支持 Scala 和 Kotlin API。
katanemo/plano
AI 原生代理与数据平面,用于交付智能体应用。通过统一数据平面,提供编排、模型路由、可观测性与安全护栏,让开发者专注于核心逻辑。支持任意语言与框架,加速生产部署。
lance-format/lance
开源湖仓格式,专为多模态 AI 设计。支持向量搜索、全文检索和随机访问,性能较 Parquet 提升 100 倍。兼容 Pandas、DuckDB、Polars、PyArrow 和 PyTorch。
mishushakov/llm-scraper
基于 TypeScript 的库,利用 LLM 将任意网页转换为结构化数据。支持 GPT、Sonnet、Gemini 等模型,使用 Zod 或 JSON Schema 定义结构,提供全类型安全。基于 Playwright,支持流式处理与代码生成,提供 HTML、原始 HTML、Markdown、文本及图像等多种格式模式。
luhengshiwo/llmforeverybody
精选大模型面试题库与系统化论文研读,覆盖从 Transformer 到 LLaMA 的技术演进,助力求职备战与深度学习。
lavague-ai/lavague
开源框架,用于开发 AI Web 代理。包含世界模型和动作引擎,可自动化网页任务。支持 Selenium、Playwright 等驱动,提供 Gradio 界面和调试工具。
josstorer/rwkv-runner
轻量级 RWKV 大语言模型管理工具,仅 8MB,全自动化部署。提供 OpenAI API 兼容接口,支持多平台安装与 WebGPU 加速,内置聊天、创作及 MIDI 硬件输入功能。
datajuicer/data-juicer
一站式基础模型数据处理系统,支持文本、图像、音频、视频多模态数据清洗、合成与分析。提供丰富的算子库和数据配方,支持 Python API、Docker 部署及云平台集成。
googlecloudplatform/agent-starter-pack
提供生产就绪的 Google Cloud AI Agent 模板,内置 CI/CD、评估与可观测性。支持 ReAct、RAG、多智能体等架构,一键部署至 Cloud Run 或 Agent Engine。