探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
统一模型服务框架。轻松构建 AI/ML 模型推理 API、多模型流水线及 LLM 应用。支持 Docker 部署与 BentoCloud 云服务,优化 CPU/GPU 利用率。
高性能 Python 库,用于处理超大规模表格数据。支持内存映射和零拷贝策略,实现每秒十亿行数据的统计计算与可视化。提供懒加载、分组聚合、高效连接等核心功能。
本地视频硬字幕提取工具,无需调用第三方API。基于深度学习,自动检测字幕区域并识别文本内容,支持87种语言,可生成SRT或TXT文件。提供快速、自动、精准三种模式,支持GPU加速,批量处理视频。
定义 AI/ML 任务的标准化技能,兼容 Claude Code、Codex、Gemini CLI 和 Cursor 等主流编码代理工具。提供 Gradio、Hugging Face CLI、数据集管理、模型训练与评估等技能,支持自定义扩展。
基于 Python 的抖音/TikTok 批量下载工具,支持去水印下载用户主页、喜欢、收藏、图文、音频及直播内容。提供异步下载、Cookie 自动获取、多接口数据模型与过滤器,高效稳定。
基于 Python 的可扩展音乐服务器。支持本地、Spotify、SoundCloud 等流媒体播放。可通过 MPD 或 Web 客户端远程控制,适合树莓派等设备,提供 Python、JSON-RPC 和 JavaScript API,便于二次开发。
基于 OCR 的生肉翻译软件,支持实时屏幕文字识别与翻译。搭载离线/在线 OCR,提供常规、在线 AI、本地 AI 等多种翻译模式。具备自动模式、账号云端同步及图片翻译功能,可处理漫画图片的识别、翻译、消字与嵌字。
EmotiVoice 是一款强大的开源 TTS 引擎,支持中英双语及 2000 多种音色。核心功能是情感合成,可生成快乐、悲伤、愤怒等多种情绪的语音。提供易用的 Web 界面和脚本接口,支持批量生成。
精选金融机器学习工具与应用集合,涵盖深度学习、强化学习等前沿技术。由 Sov.ai 支持,与顶级量化基金合作,提供实战项目与研究机会,推动投资洞察创新。
提供即用型 Docker 镜像,包含 Jupyter 应用和交互式计算工具。支持启动个人 Jupyter 服务器、团队协作及自定义 Dockerfile 构建。
利用 Git 提交历史生成像素艺术的工具,通过设置过去时间的提交日期,在 GitHub 贡献图上绘制图案。支持 Python 3/2,生成脚本并执行即可。
机器学习与深度学习资源库,包含 Python 实现的算法教程与项目。提供 PyTorch 和 TensorFlow 的详细指南,涵盖从基础到高级主题,如神经网络、目标检测和生成对抗网络。代码清晰,配有 YouTube 视频讲解,适合学习与问题解决。
基于 Transformer 的可扩展扩散模型官方 PyTorch 实现。提供预训练模型、采样与训练代码,支持 ImageNet 256x256 和 512x512 生成。
企业级预训练语音活动检测器,基于 PyTorch,支持 8k/16k 采样率,模型轻量(约 2MB),处理速度快(单线程 <1ms),准确率高,支持 ONNX 加速,适用于多种语言和噪声环境。
Imposing Consistent Light (IC-Light) 是一个图像光照操控项目。提供两种模型:文本条件重光照和背景条件重光照,均以前景图像为输入。支持通过 Gradio 演示快速启动。
Python实现经典机器学习算法,涵盖线性回归、逻辑回归、BP神经网络、SVM、K-Means、PCA及异常检测。包含数学原理、代码实现与scikit-learn库应用示例。
基于深度学习的中文语音识别系统,采用DCNN+CTC架构,支持训练与推理。提供HTTP/gRPC API服务,兼容Python 3.9+与TensorFlow 2.5+,需GPU加速训练。
可配置的调试面板集合,显示当前请求/响应的多种调试信息。支持 Django 4.2+,提供实验性异步视图支持。
一个 AI 模型性能优化库集合,包含 Speedster、Nos 和 ChatLLaMA 等工具,旨在降低推理、基础设施和数据成本。项目已进入维护阶段,不再积极更新。
Linux 设备管理器,专为罗技设备设计。支持 Unifying、Bolt、Lightspeed 或 Nano 接收器,以及 USB 和蓝牙连接。提供配对、配置、自定义按键和规则响应功能。
仅需一条命令即可自动创建 Reddit 视频,无需手动编辑或素材编排。支持自定义背景音乐、语音、子版块及 NSFW 过滤,提供明暗模式。
为开源社区托管文档,支持多种工具如 Sphinx、MkDocs,可从 Git 仓库拉取并自动构建,实现文档即代码的持续交付。
提供 MLX 框架的多种示例,涵盖文本、图像、音频和多模态模型,包括 LLM、扩散模型、Whisper 等,支持 Hugging Face 社区集成。
集成 Segment Anything 等 AI 模型,支持自动标注、检测、分割、VQA 和多模态任务,提供工业级数据标注解决方案。