大语言模型资源
探索与 大语言模型 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
grab/cursor-talk-to-figma-mcp
Cursor 与 Figma 的 MCP 集成,允许 Cursor Agentic AI 读取设计并以编程方式修改。支持批量文本替换和实例覆盖传播等自动化功能。
haifengl/smile
基于 Java 的统计机器智能与学习引擎,提供全面的机器学习算法,包括深度学习、LLM、分类、回归、聚类、特征选择、流形学习等。支持 Scala 和 Kotlin API。
lavague-ai/lavague
开源框架,用于开发 AI Web 代理。包含世界模型和动作引擎,可自动化网页任务。支持 Selenium、Playwright 等驱动,提供 Gradio 界面和调试工具。
cocoindex-io/cocoindex
基于 Rust 的高性能 AI 数据转换框架,支持增量处理和数据血缘。以声明式数据流编程,仅需约 100 行 Python 代码即可定义转换,实现源数据与目标的自动同步。
0xplaygrounds/rig
基于 Rust 构建模块化、可扩展的 LLM 应用。支持 20+ 模型提供商统一接口、10+ 向量存储集成,具备完整的 GenAI 语义规范兼容性与 WASM 支持。
olimorris/codecompanion.nvim
Neovim 中的 AI 编程助手,支持多种 LLM 和 Agent 协议,提供内联转换、代码创建和重构功能。
josstorer/rwkv-runner
轻量级 RWKV 大语言模型管理工具,仅 8MB,全自动化部署。提供 OpenAI API 兼容接口,支持多平台安装与 WebGPU 加速,内置聊天、创作及 MIDI 硬件输入功能。
memtensor/memos
AI 记忆操作系统,为 LLM 和 Agent 提供持久化技能记忆,支持跨任务复用与进化。核心功能包括统一记忆 API、多模态支持、多知识库管理、异步调度与反馈修正。
mishushakov/llm-scraper
基于 TypeScript 的库,利用 LLM 将任意网页转换为结构化数据。支持 GPT、Sonnet、Gemini 等模型,使用 Zod 或 JSON Schema 定义结构,提供全类型安全。基于 Playwright,支持流式处理与代码生成,提供 HTML、原始 HTML、Markdown、文本及图像等多种格式模式。
e2b-dev/fragments
开源 Next.js 模板,用于构建完全由 AI 生成的应用。基于 E2B SDK 安全执行代码,支持流式 UI、多栈(Python、Next.js、Vue.js 等)及多种 LLM 提供商(OpenAI、Anthropic 等)。
linkedin/liger-kernel
专为 LLM 训练设计的高效 Triton 内核集合,提升多 GPU 训练吞吐量 20%,降低内存使用 60%。兼容 Hugging Face,支持 RMSNorm、RoPE、SwiGLU 等算子,与 Flash Attention、FSDP、DeepSpeed 即插即用。新增后训练优化内核,对齐与蒸馏任务内存节省高达 80%。
rustformers/llm
基于 Rust 的大语言模型生态系统,已归档。提供 GGML 库支持,但不再维护。推荐使用 Ratchet、Candle、mistral.rs 等替代库进行模型推理。
lance-format/lance
开源湖仓格式,专为多模态 AI 设计。支持向量搜索、全文检索和随机访问,性能较 Parquet 提升 100 倍。兼容 Pandas、DuckDB、Polars、PyArrow 和 PyTorch。
sindresorhus/awesome-chatgpt
Awesome ChatGPT 是一个精选列表,汇集了与 ChatGPT 相关的官方资源、应用、工具、集成和社区内容,帮助用户快速发现和利用 ChatGPT 的各种可能性。
open-llm-vtuber/open-llm-vtuber
支持免提语音交互、语音打断和 Live2D 虚拟形象的本地多平台 AI 伴侣。基于 Python,可离线运行,提供网页版和桌面客户端。
microsoft/taskweaver
首个“代码优先”智能体框架,用于无缝规划和执行数据分析任务。通过代码片段解释用户请求,协调插件以有状态方式执行任务。保留聊天历史和代码执行历史,支持处理复杂数据结构。
j3ssie/osmedeus
现代安全编排引擎,支持声明式 YAML 工作流、多运行器、事件驱动触发、模板引擎、实用函数、REST API、分布式执行、通知集成、云存储及 LLM 集成。提供 CLI 与 Web UI,支持 Docker 部署。
prefecthq/marvin
Python 框架,用于构建结构化输出和 AI 智能体工作流。提供直观 API,支持任务、智能体和线程编排,实现类型安全的 AI 集成。
multimodal-art-projection/yue
开源全曲音乐生成基础模型,类似 Suno.ai。支持歌词转完整歌曲,包含人声与伴奏,涵盖多语言与风格。提供演示、论文及多种模型版本。
datajuicer/data-juicer
一站式基础模型数据处理系统,支持文本、图像、音频、视频多模态数据清洗、合成与分析。提供丰富的算子库和数据配方,支持 Python API、Docker 部署及云平台集成。
canopyai/orpheus-tts
基于 Llama-3b 的 SOTA 开源 TTS,支持类人语音、零样本克隆、情感引导和低延迟流式推理。提供多语言模型及训练指南,支持 Baseten 一键部署。
nilsherzig/llocalsearch
完全本地运行的搜索聚合器,使用 LLM Agent 链处理问题。无需 OpenAI 或 Google API 密钥,保护隐私。支持实时进度查看、追问和移动端设计。
airweave-ai/airweave
开源 AI 代理上下文检索层,连接应用、工具和数据库,持续同步数据,通过统一的 LLM 友好搜索接口提供实时、多源上下文检索。
googlecloudplatform/agent-starter-pack
提供生产就绪的 Google Cloud AI Agent 模板,内置 CI/CD、评估与可观测性。支持 ReAct、RAG、多智能体等架构,一键部署至 Cloud Run 或 Agent Engine。
aiwaves-cn/agents
开源框架,用于数据驱动、自我进化的自主语言代理。基于符号学习,实现类似神经网络的前向传播、反向传播和权重更新,支持多代理系统优化。
katanemo/plano
AI 原生代理与数据平面,用于交付智能体应用。通过统一数据平面,提供编排、模型路由、可观测性与安全护栏,让开发者专注于核心逻辑。支持任意语言与框架,加速生产部署。
pawanosman/chatgpt
提供免费的 ChatGPT API 反向代理,兼容官方接口,支持流式响应。无需 API 密钥即可自托管或使用托管服务。
princeton-nlp/tree-of-thought-llm
基于大语言模型的树状思维框架,实现深思熟虑的问题求解。支持 BFS/DFS 搜索算法,可自定义任务与提示,用于游戏、填字等复杂推理场景。
om-ai-lab/vlm-r1
基于强化学习的 R1 风格视觉语言模型,提升视觉理解的泛化能力。支持 GRPO 全量微调、LoRA、多节点训练及多图像输入。在 REC 和 OVD 任务上表现优异,模型已在 Hugging Face 开源。
jerryzliu/dayflow
自动生成每日时间线,通过 AI 分析屏幕内容,提供上下文感知的活动追踪。隐私优先,数据本地处理,支持多种 AI 模型。开源、轻量、高效,适用于 macOS。