探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
InternLM 系列开源大模型,涵盖 InternLM、InternLM2、InternLM2.5 和 InternLM3。最新 InternLM3-8B-Instruct 以 4 万亿高质量 token 训练,成本降低超 75%,在推理与知识密集型任务上性能领先,支持深度思考与流畅对话模式。
基于超过 200k 小时多语言语音数据训练的开源权重 TTS 模型,提供媲美顶级供应商的表达力与质量。支持零样本语音克隆,仅需 10-30 秒参考音频即可生成高质量语音。具备多语言支持(英、日、中、法、德)及细粒度音频控制(语速、音调、情感),输出原生 44kHz 音频。提供 Gradio WebUI 和 Docker 部署,RTX 4090 上实时因子约 2x。
基于 Python 3.7 和 asyncio 构建的 LBRY SDK,提供去中心化 P2P 协议实现。包含 Kademlia DHT、数据交换协议、区块链钱包及 JSON-RPC 守护进程,用于开发抗审查的数字内容应用。
Python 库,用于 Docker Engine API。支持运行、管理容器和 Swarm,功能与 docker 命令等效。通过 pip 安装,从环境配置连接。
提供目标检测脚本与改进思路,涵盖YOLO系列(v8/v10/v11/v12)及RT-DETR的模型改进、剪枝与知识蒸馏方案,支持多种任务与部署优化。
专为闲鱼平台打造的 AI 客服机器人系统,实现 7×24 小时自动化值守。支持多专家协同决策、智能议价和上下文感知对话,核心基于 Python 与 LLM 技术。
基于GPT的PDF对话工具,无需向量数据库,使用简单架构实现高精度问答。支持Turbo和GPT4模型,可处理长文档并引用页码。
将 Jupyter Notebook 转为纯文本格式(如 .py 或 .md),便于版本控制和 IDE 编辑。支持配对笔记本,保留输出并实现双向同步。
基于 CDP 的自愈式浏览器操控框架,赋予 LLM 完成任意浏览器任务的完全自由。无需框架,直接连接 Chrome,支持动态编写缺失功能。
Celery 分布式任务队列的实时监控与 Web 管理面板。提供任务状态、进度、历史记录查看,支持远程控制 Worker(如重启、调整池大小)、队列监控、OAuth 认证及 Prometheus 集成。
实时高分辨率背景抠像。基于 PyTorch,支持 4K 30fps 与 HD 60fps 实时处理。提供预训练模型、数据集及多种推理脚本,适用于图像与视频。
基于 Llama-2 的中文大模型,扩展中文词表并增量预训练,支持 4K/16K/64K 超长上下文,开源基座与指令精调模型,兼容主流 LLM 生态工具。
智能、自动、快速且轻量的 Python 网页抓取工具。通过样本数据自动学习抓取规则,支持获取相似或精确内容,可保存和加载模型。
基于 Wi-Fi CSI 信号分析的运动检测系统,无需摄像头或麦克风。通过 ESP32 设备实时分析无线信号变化,集成 Home Assistant 实现智能家居自动化。支持多种算法,部署简单,注重隐私保护。
Binance 交易所 API 的 Python 非官方封装库,支持自动化交易。提供完整的 REST API 实现、异步支持、WebSocket 处理、现货、期货、期权及保证金交易,并具备代理、测试网和多种认证方式。
基于 Keras 和 TensorFlow 实现的 YOLOv3 目标检测模型。支持模型转换、图像/视频检测及多 GPU 训练,提供完整的训练与推理流程。
简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持 ChatGPT 多轮对话与脑机交互唤醒。模块化设计,集成多家中英文语音识别与合成技术,可联动智能家居,安装简单,支持多平台。
强大的命令行书签管理器,支持隐私保护、便携数据库、多格式导入导出及 Web 界面。可自动获取标题、标签和描述,提供深度搜索、正则匹配和 Wayback Machine 链接检查功能。
基于 Python 的 3D 视觉几何模型,通过单目或双目图像轻松重建 3D 场景。支持多种分辨率与预训练模型,提供交互式演示与 Docker 部署选项。
一个 Python 包,用于解决机器学习中数据集类别不平衡问题。提供多种重采样技术,与 scikit-learn 兼容,是 scikit-learn-contrib 项目的一部分。
开源多语言多模态对话模型系列,包含 32B 参数规模的 GLM-4-32B-0414、推理模型 GLM-Z1-32B-0414、深度思考模型 GLM-Z1-Rumination-32B-0414 以及 9B 轻量模型 GLM-Z1-9B-0414。支持本地部署,性能对标 GPT 系列与 DeepSeek V3/R1,适用于代码生成、函数调用、搜索问答及报告生成等任务。
全功能 WebUI,支持 AI 生成图像与视频、字幕及处理。多平台兼容,包括 nVidia CUDA、AMD ROCm、Intel Arc、DirectML、OpenVINO 等。内置模型编译与量化优化,支持 150+ OpenCLiP 和 20+ VLM 模型进行交互/字幕处理。
基于 Rust 的高性能 AI 数据转换框架,支持增量处理和数据血缘。以声明式数据流编程,仅需约 100 行 Python 代码即可定义转换,实现源数据与目标的自动同步。