探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
通义千问官方仓库,提供 Qwen 系列大语言模型,包括 1.8B、7B、14B、72B 参数的基座与对话模型。支持 Hugging Face、ModelScope、Demo 及 API,已开源。
基于 Whisper 的高速语音识别工具,提供单词级时间戳和说话人识别。支持批量推理,速度达实时 70 倍,使用 wav2vec2 进行音素对齐,pyannote-audio 进行说话人分离。
开放神经网络交换标准,为 AI 模型提供开源格式,支持深度学习和传统机器学习。定义可扩展的计算图模型、内置算子和标准数据类型,专注于推理能力。广泛支持多种框架、工具和硬件,促进 AI 社区创新。
开源身份提供商,支持 SAML、OAuth2/OIDC、LDAP、RADIUS 等协议,适用于自托管场景,从实验室到生产集群。
开源企业级智能体平台,支持 RAG 管道、工作流编排和 MCP 工具调用。提供多模态输入输出,兼容各类大模型,可快速集成至第三方系统。
基于 Django 的开源 CMS,专注于用户体验与灵活性。提供快速界面、完整前端控制、可扩展至百万页面。支持 StreamField、多站点、多语言及内容 API,适用于各类规模项目。
网络自动化的核心源数据,提供全面的网络基础设施建模与文档化。支持 IPAM、DCIM、设备配置管理,拥有强大 API 和灵活权限系统,是现代网络的单一事实来源。
OpenAI 发布的两款开源权重语言模型 gpt-oss-120b 与 gpt-oss-20b,支持可配置的推理强度与完整思维链,具备函数调用、网页浏览及 Python 代码执行等智能体能力。采用 Apache 2.0 许可,支持微调与 MXFP4 量化,适配单 GPU 部署。
基于大语言模型的多语种语音生成系统,支持零样本克隆与流式推理。覆盖9种语言及18+中方言,提供发音修复、文本归一化与指令控制。性能领先,延迟低至150ms,适用于生产环境。
实时 AI 声音转换软件,支持 RVC、Beatrice 等多种模型。提供独立与网络模式,兼容 Windows、Mac、Linux 平台,支持 REST API 调用。
基于 TensorFlow 的机器智能音乐与艺术生成研究项目,提供 Python 库及工具,支持歌曲、图像等创作。项目已归档,新工作请访问 Magenta 官网与 GitHub 组织。
基于 Docker 的自动化 Nginx 反向代理,使用 docker-gen 为容器动态生成配置并重载 Nginx。支持 Debian 和 Alpine 镜像,需共享 Docker 网络并暴露端口。
由字节跳动 Seed 团队发起的 RL 训练库,支持灵活扩展多种 RL 算法,无缝集成现有 LLM 框架,具备高效资源利用和 SOTA 吞吐量。
一个用于 Python 的反应式笔记本,可运行可复现实验、用 SQL 查询、作为脚本执行、作为应用部署,并使用 git 进行版本控制。存储为纯 Python 文件,配备现代化、AI 原生的编辑器。
Python3 网络爬虫实战项目,涵盖淘宝、京东、网易云、B站、12306、抖音、笔趣阁等平台,提供漫画小说、音乐电影下载工具及验证码识别、代理IP池构建等实用脚本。
开源 AI 软件工程师,能理解指令、拆解步骤、研究信息并编写代码。支持 Claude 3、GPT-4、Gemini 等多种模型及本地 LLM,具备高级规划推理与网页浏览能力。项目处于早期开发阶段,欢迎贡献。
基于 Python 的事件驱动回测与实盘交易库,支持 PyData 生态集成,提供常见统计指标与机器学习库支持,易于使用且功能全面。
开源一站式 Agentic 个人和群聊助手,支持 QQ、Telegram、企业微信等数十个平台。内置 Agent Sandbox、插件市场、WebUI 和 ChatUI,提供多模态对话、知识库、技能与自动化能力。
全流程加速科研:利用 ChatGPT 对 arXiv 论文进行全文总结、专业翻译、润色、审稿及审稿回复。支持本地 PDF 全文翻译与一键生成 XMind 笔记。
Python 伪数据生成库,支持数据库填充、XML 文档创建、压力测试和数据脱敏。灵感源自 PHP、Perl 和 Ruby 的 Faker,提供多语言本地化支持,兼容 Python 3.8+。
工业级可控高效零样本语音合成系统。支持自回归生成与精确时长控制,实现情感与音色解耦。通过 GPT 潜在表征与三阶段训练提升稳定性,支持多模态情感引导。
基于 CAMEL-AI 的多智能体协作框架,用于现实世界任务自动化。在 GAIA 基准测试中排名第一,平均分 69.09。支持 Python,提供多种安装选项和 Web 界面。
1.6B 参数 TTS 模型,单次生成超逼真对话。支持音频条件控制情感与语调,可生成笑声、咳嗽等非语言声音。提供预训练模型与推理代码,支持 Hugging Face Transformers。
基于用户名从数千个网站收集个人档案信息,支持 Tor、I2P 站点及域名解析。无需 API 密钥,提供递归搜索、标签过滤及反审查检测功能。