大语言模型资源
探索与 大语言模型 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
modelscope/FunASR
一个基础的端到端语音识别工具包和开源的最先进预训练模型,支持语音识别、语音活动检测、文本后处理等功能。
Unstructured-IO/unstructured
轻松将文档转换为结构化数据。Unstructured 是一个开源的 ETL 解决方案,用于将复杂的文档转换为干净、结构化的格式,以供语言模型使用。访问我们的网站,了解更多关于我们适用于生产级工作流的企业级平台产品,包括分区、丰富、分块和嵌入等功能。
Lightning-AI/litgpt
20+ 高性能大语言模型,提供可扩展的预训练、微调和部署方案。
pydantic/pydantic-ai
Agent Framework / 用于在LLMs中使用Pydantic的适配器
PaddlePaddle/PaddleNLP
易于使用且功能强大的大语言模型(LLM)和小语言模型(SLM)库,拥有丰富的模型库。
dottxt-ai/outlines
结构化文本生成
ShishirPatil/gorilla
Gorilla:用于函数调用(工具调用)的大型语言模型训练与评估
eugeneyan/open-llms
📋 可用于商业用途的开源大语言模型(LLM)列表。
AstrBotDevs/AstrBot
✨ 易上手的多平台 LLM 聊天机器人及开发框架 ✨ 支持 QQ、QQ频道、Telegram、企微、飞书、钉钉 | 知识库、MCP 服务器、OpenAI、DeepSeek、Gemini、硅基流动、月之暗面、Ollama、OneAPI、Dify
RockChinQ/LangBot
🤩 简单易用的大模型即时通信机器人开发平台 ⚡️ 支持 QQ / QQ 频道 / Discord / 微信(企业微信、个人微信)/ Telegram / 飞书 / 钉钉 / Slack 等平台的机器人 🧩 已集成 ChatGPT、DeepSeek、Dify、n8n、Claude、Google Gemini、xAI、PPIO、Ollama、阿里云百炼、SiliconFlow、通义千问、Moonshot、SillyTraven、MCP、WeClone 等大模型与智能代理技术
Canner/WrenAI
⚡️Wren AI 是你的生成式生物信息学代理,你可以用自然语言查询任何数据库 → 在几秒钟内获得准确的 SQL(文本转SQL)、图表(文本转图表)和 AI 生成的洞见。
zai-org/CogVideo
None
h2oai/h2ogpt
与本地GPT进行私密聊天,支持文档、图像、视频等,100%隐私保护,采用Apache 2.0许可。支持oLLaMa、Mixtral、llama.cpp等。演示:https://gpt.h2o.ai/ https://gpt-docs.h2o.ai/
RUCAIBox/LLMSurvey
调查论文《大型语言模型综述》的官方GitHub页面。
bentoml/OpenLLM
在云中以与 OpenAI 兼容的 API 端点运行任何开源大语言模型,例如 DeepSeek 和 Llama。
NVIDIA/TensorRT-LLM
TensorRT-LLM 为用户提供了易于使用的 Python API,用于定义大型语言模型(LLMs),并支持最先进的优化技术,以在 NVIDIA GPU 上高效地进行推理。TensorRT-LLM 还包含用于创建 Python 和 C++ 运行时的组件,这些组件可以以高效的方式协调推理执行。
THUDM/CogVideo
文本和图像到视频生成:CogVideoX(2024)和CogVideo(ICLR 2023)
GoogleCloudPlatform/generative-ai
Google Cloud 上生成式 AI 的示例代码和笔记本,包含 Vertex AI 上的 Gemini
neuml/txtai
💡 用于语义搜索、大型语言模型编排和语言模型工作流的全合一开源AI框架
ludwig-ai/ludwig
低代码框架,用于构建自定义的大语言模型、神经网络和其他人工智能模型
The-Pocket/PocketFlow-Tutorial-Codebase-Knowledge
PocketFlow:从代码库到教程
confident-ai/deepeval
LLM评估框架
TheR1D/shell_gpt
一个由AI大语言模型(如GPT-4)驱动的命令行生产力工具,将帮助您更快、更高效地完成任务。
EmbraceAGI/awesome-chatgpt-zh
ChatGPT 中文指南🔥,ChatGPT 中文调教指南,指令指南,应用开发指南,精选资源清单,更好的使用 chatGPT 让你的生产力 up up up! 🚀
ConardLi/easy-dataset
一个用于为大型语言模型创建微调数据集的强大工具
explodinggradients/ragas
为您的LLM应用评估加速 🚀
getumbrel/llama-gpt
一个自托管、离线的类ChatGPT聊天机器人。由Llama 2驱动。100%私密,数据不会离开您的设备。新特性:支持Code Llama!
cleanlab/cleanlab
用于数据质量和带有杂乱、真实世界数据及标签的机器学习的标准数据驱动AI包。
googleapis/genai-toolbox
None
Chainlit/chainlit
在几分钟内构建对话式人工智能 ⚡️