探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
本地视频硬字幕提取工具,无需调用第三方API。基于深度学习,自动检测字幕区域并识别文本内容,支持87种语言,可生成SRT或TXT文件。提供快速、自动、精准三种模式,支持GPU加速,批量处理视频。
基于OpenSPG引擎和LLM的逻辑形式引导推理与检索框架,用于构建专业领域知识库的逻辑推理与事实问答方案。克服传统RAG向量相似度计算的模糊性,支持逻辑推理与多跳事实问答,性能显著优于当前SOTA方法。
Ferret 是一个端到端多模态大语言模型,支持任意形式的指代与细粒度定位。核心贡献包括混合区域表示与空间感知视觉采样器,以及大规模分层指令数据集 GRIT。项目提供 7B 与 13B 模型权重、训练脚本及评估基准。
精选利用 Shizuku 的 Android 应用列表。Shizuku 允许普通应用通过 ADB 在非 root 设备上以提升的权限直接使用系统 API。涵盖自动化、音频、文件管理、开发工具等多类应用。
静态代码分析工具,用于基础设施即代码(IaC)和软件成分分析(SCA)。扫描 Terraform、CloudFormation、Kubernetes 等配置,检测安全与合规性误配置,并提供超过 1000 条内置策略。
OSINT 分析与研究工具,用于实时追踪目标并执行社会工程攻击。具备定位优化、REST API、浏览器钩子、网络隧道、凭证获取及网络信息扫描等功能,帮助政府、企业和研究人员追踪网络犯罪。
基于 Python 的自动化加密货币交易机器人,专为 Binance 平台设计。采用桥接货币(如 USDT)在多种币种间进行套利交易,通过算法在强势币与弱势币之间轮换,旨在提升资产持有量。支持 Heroku 和 DigitalOcean 一键部署,提供社区交流渠道。
基于音频驱动的人像动画生成工具,支持分层视觉合成,可将静态肖像转化为动态视频。提供模型训练代码、HuggingFace 演示及多种社区集成。
基于高斯过程的全局优化 Python 库,适用于高成本函数,平衡探索与利用,支持约束优化。
统一模型服务框架。轻松构建 AI/ML 模型推理 API、多模型流水线及 LLM 应用。支持 Docker 部署与 BentoCloud 云服务,优化 CPU/GPU 利用率。
基于 Docker / 青龙面板 / 群晖的每日签到脚本,支持多账号。集成爱奇艺、Bilibili、阿里云盘等平台签到,提供多种通知方式。
Linux 设备管理器,专为罗技设备设计。支持 Unifying、Bolt、Lightspeed 或 Nano 接收器,以及 USB 和蓝牙连接。提供配对、配置、自定义按键和规则响应功能。
CLI 工具和 Python 库,将常用命令行工具、文件类型和字符串输出转换为 JSON、YAML 或字典,便于管道处理和自动化脚本。
基于 Python 的抖音/TikTok 批量下载工具,支持去水印下载用户主页、喜欢、收藏、图文、音频及直播内容。提供异步下载、Cookie 自动获取、多接口数据模型与过滤器,高效稳定。
现代 Python 包与依赖管理器,支持最新 PEP 标准。提供快速依赖解析、PEP 517 构建后端、PEP 621 项目元数据、灵活插件系统及集中式安装缓存。可管理虚拟环境,兼容 pyproject.toml 与 lockfile。
强大的 GUI 智能体家族,支持跨平台自动化操作。提供在线演示与 API,集成 GUI-Owl 多模态模型,适用于 OSWorld、AndroidWorld 及真实移动场景。
提供 66 项全栈开发专用技能,将 Claude Code 转变为专家结对编程助手。支持 Python,包含 9 种工作流,自动上下文感知激活与多技能协同。
实时高精度全身多人姿态估计与跟踪系统。支持COCO、MPII等数据集,提供PoseFlow在线跟踪器,性能领先。兼容Linux与Windows,提供Colab快速启动。
基于 OCR 的生肉翻译软件,支持实时屏幕文字识别与翻译。搭载离线/在线 OCR,提供常规、在线 AI、本地 AI 等多种翻译模式。具备自动模式、账号云端同步及图片翻译功能,可处理漫画图片的识别、翻译、消字与嵌字。
提供 MLX 框架的多种示例,涵盖文本、图像、音频和多模态模型,包括 LLM、扩散模型、Whisper 等,支持 Hugging Face 社区集成。
Python 客户端,用于百度云/百度网盘。支持文件列表、上传、下载、同步、比较等操作。主要面向 Linux 环境(如树莓派),提供命令行界面。支持 Unicode/中文,具备失败重试、递归操作和哈希缓存功能。项目已进入维护模式,仅修复重大 Bug。
基于 Transformer 的可扩展扩散模型官方 PyTorch 实现。提供预训练模型、采样与训练代码,支持 ImageNet 256x256 和 512x512 生成。
精选金融机器学习工具与应用集合,涵盖深度学习、强化学习等前沿技术。由 Sov.ai 支持,与顶级量化基金合作,提供实战项目与研究机会,推动投资洞察创新。