探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
🚀 1小时从零训练26M参数视觉多模态VLM!成本仅1.3元,个人GPU即可推理训练。包含完整VLM结构、数据集清洗、预训练与SFT全流程代码,是入门视觉语言模型的简明教程。
基于 Azure OpenAI 和 Azure AI Search 的 RAG 聊天应用示例。使用 Python 构建,支持多轮对话、引用渲染和 UI 设置调整。集成文档索引与检索,支持多种文档格式和云数据摄入,可选多模态模型、语音输入输出及 Microsoft Entra 登录自动化。
基于 PyTorch 的变分自编码器 (VAE) 集合,专注于可复现性。提供多种 VAE 模型(如 VAE、Conditional VAE、WAE、Beta-VAE 等)的实现,均在 CelebA 数据集上训练。支持 PyTorch Lightning,提供配置文件和 TensorBoard 日志。
将 LLM 编码能力转化为图像生成能力,通过虚拟 Canvas 代理编写代码来组合图像视觉内容。提供基于 Llama3 和 Phi3 的预训练模型,支持 HuggingFace Space 或本地部署。
免费英文->中文双解词典数据库,收录数十万词条,包含音标、释义、考试大纲标注(四六级/雅思等)及 BNC 与当代语料库词频。特色在于提供动词时态、形容词比较级等词形变化(Exchange 字段),并支持 CSV/SQLite/MySQL 格式及 Python 编程接口。
基于《深度学习》(花书)的数学推导与原理剖析,使用 Python 和 NumPy 从零实现书中核心算法,提供完整 PDF 文档与源码级代码实现。
将 Python 代码片段编译为对应的 LaTeX 表达式,支持 Python 3.9 至 3.13,基于 AST 的规则系统实现。
低开销 Python 代码执行追踪与可视化工具,支持多线程、多进程、异步及 PyTorch,提供强大的前端界面,可平滑渲染 GB 级追踪数据。
基于 HuggingFace Transformers 的中文 GPT-2 训练代码,支持 BERT、分词及 BPE 三种分词器。可生成诗歌、新闻、小说,或训练通用语言模型,适用于大规模语料。
基于特朗普的编程语言,仅支持整数、大数和特定词汇,错误信息来自特朗普言论,程序必须以“America is great”结尾。
灵活强大的开源框架,用于编排多个 AI 代理处理复杂对话。支持智能意图分类、双语实现、流式与非流式响应、上下文管理及可扩展架构。提供预构建代理,可部署于 AWS Lambda、本地或任何云平台。
基于 ChatGLM2-6B 架构的多语言代码生成模型,支持 8192 序列长度与 6GB 显存量化推理。提供 VS Code、JetBrains 等 IDE 插件,支持上下文补全、代码翻译及 AI 对话编程助手。开源权重,支持学术与商业使用。
提供 Llama 系列大语言模型的实用工具,支持 Llama 2、3、3.1、3.2、3.3、4 等版本的下载、管理与使用。通过 CLI 工具简化模型获取流程,适用于开发者、研究人员及企业构建生成式 AI 应用。
基于Python的量化交易项目,涵盖数据分析、机器学习预测、交易执行及券商自动化接口。提供A股、港股、基金、可转债等多市场数据采集与策略实现,支持本地与云端部署。
OpenMMLab 姿态估计工具箱与基准。支持 2D/3D 人体、手部、面部、全身、动物等多种姿态估计任务。基于 PyTorch,提供丰富模型库与高效训练推理。
利用 BERT 和 c-TF-IDF 创建易于解释的主题,支持多种主题建模技术,包括引导式、监督式、半监督式、手动、多主题分布、层次化、基于类别、动态、在线/增量、多模态、多方面、文本生成/LLM、零样本、合并模型和种子词。
安卓应用层抓包通杀脚本,支持 Android 7-14,无视证书校验与加固,覆盖 HTTP、WebSocket、SSL 等多种协议及主流框架,可导出客户端证书并定位收发包函数。
Kubernetes 官方 Python 客户端库,提供对 Kubernetes API 的完整访问。支持通过 PyPI 安装,包含 Pod 列表、资源监控等示例代码,并与多个 Kubernetes 版本保持兼容。
ARIS ⚔️ 通过 Markdown 技能实现自主 ML 研究:跨模型评审循环、想法发现与实验自动化。零依赖、无框架锁定,兼容 Claude Code、Codex、OpenClaw 等任意 LLM 代理。
基于 ChatTTS 的本地网页语音合成工具,支持中英文数字混杂文本转语音,提供 Web 界面与 API 接口。支持 GPU 加速,提供 Windows 预打包版、Linux 容器及源码部署方式。
实时交互流式数字人,支持 wav2lip、musetalk、ernerf 等多模型,实现音视频同步对话。支持声音克隆、动作编排、多并发及 WebRTC/虚拟摄像头输出。
PyTorch 实现 DINO 自监督学习方法,用于 Vision Transformers 训练。提供多种预训练模型(ViT-S/B、ResNet-50)及权重下载,支持下游任务。
跨平台 GUI 工具,用于在系统中查找重复文件。主要使用 Python 3 编写,基于 Qt 框架。支持 Linux、macOS 和 Windows。
全网优秀开源攻防武器项目集成库,涵盖信息收集、漏洞利用、内网渗透、应急响应及甲方安全资料,每周自动更新,供攻防双方学习研究。
💎 1MB 超轻量级人脸检测模型,专为边缘计算设备设计。提供 version-slim 和 version-RFB 两个版本,支持多种推理框架(NCNN、MNN、Caffe、ONNX),并提供 FP32/INT8 量化模型。在 WIDER FACE 数据集上表现优异,推理速度快,适用于低功耗设备。