探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
免费英文->中文双解词典数据库,收录数十万词条,包含音标、释义、考试大纲标注(四六级/雅思等)及 BNC 与当代语料库词频。特色在于提供动词时态、形容词比较级等词形变化(Exchange 字段),并支持 CSV/SQLite/MySQL 格式及 Python 编程接口。
总结 NLP 工程师所需知识,涵盖面试题、基础知识与工程能力。内容聚焦 Transformer、BERT、知识蒸馏、词向量等核心主题,提供代码解析与实战经验,助力提升核心竞争力。
PyTorch 实现 DINO 自监督学习方法,用于 Vision Transformers 训练。提供多种预训练模型(ViT-S/B、ResNet-50)及权重下载,支持下游任务。
Python 库,用于操作 Google Sheets。支持通过标题、密钥或 URL 打开表格,读写格式化单元格范围,共享与访问控制,以及批量更新。需 Python 3.8+,通过 pip 安装。
安卓应用层抓包通杀脚本,支持 Android 7-14,无视证书校验与加固,覆盖 HTTP、WebSocket、SSL 等多种协议及主流框架,可导出客户端证书并定位收发包函数。
基于 PyTorch 的 YOLOv3 极简实现,支持训练、推理与评估。兼容 YOLOv4 和 YOLOv7 权重,提供 CLI 工具与 API。
根据项目导入自动生成 requirements.txt 文件。支持 Jupyter Notebook,可忽略目录、使用本地包信息、自定义 PyPI 服务器及代理。提供 diff 和 clean 功能,支持动态版本号方案。
利用 BERT 和 c-TF-IDF 创建易于解释的主题,支持多种主题建模技术,包括引导式、监督式、半监督式、手动、多主题分布、层次化、基于类别、动态、在线/增量、多模态、多方面、文本生成/LLM、零样本、合并模型和种子词。
一个基于 ChatGPT 管理真实资金微盘股投资组合的实验项目,提供完整的交易记录、分析工具和研究文档,用于评估大语言模型作为投资决策者的表现。
自动优化 Linux CPU 频率和功耗,实时监控电池、温度与负载,延长续航且无性能妥协。支持 GUI 和 CLI,适用于笔记本。
OpenMMLab 姿态估计工具箱与基准。支持 2D/3D 人体、手部、面部、全身、动物等多种姿态估计任务。基于 PyTorch,提供丰富模型库与高效训练推理。
通用大上下文多模态自回归模型,支持百万级 token 的文本和视频理解与生成。基于 RingAttention 技术训练,可处理长视频和书籍,具备语言、图像、视频的问答与生成能力。
基于 Megatron 和 DeepSpeed 的 GPU 上模型并行自回归 Transformer 实现,支持 ZeRO 和 3D 并行训练,适配多种硬件与调度系统,提供预定义架构配置及与 Hugging Face 生态的集成。
基于 TensorFlow 的深度学习与强化学习库,专为科研人员和工程师设计。提供可定制神经网络层,支持快速构建高级 AI 模型。社区开源大量教程与应用,荣获 ACM 多媒体学会 2017 年度最佳开源软件奖。
Python 网络爬虫入门精华教程,涵盖抓取、分析、存储三大板块。详解 requests、urllib2 等库的使用,处理登录、反爬虫、代理、多进程等实战技巧,并介绍 Scrapy 框架。
高性能开源音乐生成模型,支持 Mac、AMD、Intel 和 CUDA 设备。生成速度快,A100 上每首歌不到 2 秒,RTX 3090 上不到 10 秒。支持 10 秒到 10 分钟的音频生成,以及 50 多种语言的歌词。提供 LoRA 训练、音频编辑和音轨分离等功能。
为 Linux 提供 Windows Hello™ 风格的面部认证。利用内置红外发射器和摄像头,结合面部识别技术证明身份。通过 PAM 集成,适用于登录、锁屏、sudo 等所有需要密码的场景。
全网优秀开源攻防武器项目集成库,涵盖信息收集、漏洞利用、内网渗透、应急响应及甲方安全资料,每周自动更新,供攻防双方学习研究。
从安全角度全面介绍 Web 应用防火墙 (WAF) 的资源集合。涵盖工作原理、操作模式、测试方法、指纹识别、绕过技术、工具、研究论文及博客文章,旨在为安全测试人员和研究人员提供参考。
跨平台 GUI 工具,用于在系统中查找重复文件。主要使用 Python 3 编写,基于 Qt 框架。支持 Linux、macOS 和 Windows。
基于 Python 的网页版微信 API,支持终端版微信及微信机器人。提供完整的登录流程、联系人管理、消息同步与自动回复功能,兼容 Python 2.7 和 3.6。
基于 TensorFlow 的图卷积网络实现,用于图节点的半监督分类。支持多种模型,包括 GCN、Chebyshev 多项式变体及基础多层感知机。提供 Cora、Citeseer 等数据集示例,支持自定义图数据。
高级 Python 任务调度库,支持同步与异步。提供持久化存储(PostgreSQL、MySQL、SQLite、MongoDB)和事件代理(PostgreSQL、Redis、MQTT)。具备 Cron、间隔、日历和单次调度机制,支持水平扩展与高可用。
提供 Keras 深度学习模型的代码与预训练权重,包括 VGG、ResNet、Inception 等经典架构。支持图像分类与特征提取,兼容 TensorFlow/Theano,权重可自动下载。已弃用,请使用 keras.applications。
精选编程演讲合集,涵盖多种语言与理论主题,由社区贡献维护。包含 Scott Meyers、Rich Hickey 等知名演讲者推荐。