探索 Python 项目
筛选并发现收录的、配有高质量中文文档或教程的 GitHub 项目。
自动清理 LaTeX 代码,移除注释、辅助文件和未使用资源,优化大小以适应 arXiv 50MB 限制。支持图像压缩、PDF 压缩和 TikZ 图片源码隐藏,通过配置文件实现高级正则替换。
基于 Python 的音频指纹识别库。通过一次聆听即可记忆音频特征,支持从麦克风或文件中识别匹配的歌曲。适用于含合理噪声的精确信号识别,不适用于语音识别。
开源多模态视觉语言模型,支持图像理解与多轮对话,分辨率高达 1120*1120。CogVLM-17B 在 10 项跨模态基准中达到 SOTA,CogAgent-18B 在 GUI 操作任务上表现卓越。
LLM 评估平台,支持 Llama3、Mistral、InternLM2、GPT-4 等多种模型及 100+ 数据集。提供强大算法与直观界面,助力高效评估 NLP 模型质量与效果。
通用 AI 应用沙箱平台,提供多语言 SDK、统一 API 及 Docker/Kubernetes 运行时,支持编码代理、GUI 代理、评估与 RL 训练等场景。
基于 AWS SAM 的 CLI 工具,用于构建、测试、调试和部署无服务器应用。支持 Lambda、Step Functions、API Gateway 等服务,提供本地测试、云同步、部署及 CI/CD 流水线创建功能。
基于论文的多领域中文分词工具包,支持新闻、网络、医药、旅游等细分领域预训练模型,提供更高分词准确率,支持用户自训练模型与词性标注。
基于 Wi-Fi CSI 信号分析的运动检测系统,无需摄像头或麦克风。通过 ESP32 设备实时分析无线信号变化,集成 Home Assistant 实现智能家居自动化。支持多种算法,部署简单,注重隐私保护。
一站式大模型训练工具,支持预训练、指令微调和DPO。兼容Qwen2.5、Llama3、Gemma等主流模型,提供全量、LoRA、QLoRA高效训练方案。集成Unsloth加速,节省显存与时间。开源数据集与模型权重。
基于 Chromium 的浏览器自动化库,无需 WebDriver。提供 100% 类型安全、原生异步架构,支持高级反检测与网络控制,适用于高性能爬虫。
🚀 1小时从零训练26M参数视觉多模态VLM!成本仅1.3元,个人GPU即可推理训练。包含完整VLM结构、数据集清洗、预训练与SFT全流程代码,是入门视觉语言模型的简明教程。
Python 日期时间处理库,提供更简洁易用的 API。支持时区感知、无缝切换、人性化时间差显示,并正确处理 DST 转换和时间规范化。可作为标准 datetime 的直接替代品。
Mycroft Core 是 Mycroft AI 平台的开源语音助手核心。主要使用 Python 开发,提供可扩展的技能系统和配置管理。项目已停止维护,建议关注其精神继承者 Open Voice OS 和 Neon-core。
基于Python的AWS EC2负载测试工具,可快速创建大量微实例对Web应用发起并发攻击,支持多区域测试与Hurl集成。
Python中文文本处理库,支持分词、词性标注、情感分析、文本分类、拼音转换、繁简转换、关键词提取、摘要生成、TF-IDF、句子分割、文本相似度计算。基于自研算法,无需NLTK,自带训练模型。
免费在线学习平台,让优质教育触手可及。用户可轻松创建并分享互动式探索活动,模拟一对一辅导,通过实践与反馈进行学习。平台基于 Python、Angular 和 Google App Engine 构建。
Python 3 在浏览器中的实现,支持 DOM 操作和事件处理。无需安装,通过 CDN 加载即可使用。兼容标准库,可与 jQuery、D3 等 JS 库交互,支持 HTML5/CSS3 及 Bootstrap 等框架。
开源深度学习工具包,专注于药物发现、量子化学、材料科学和生物学。支持 TensorFlow、PyTorch 和 JAX,提供丰富的模型库和教程。
开源库存管理系统,基于 Python/Django 构建,提供强大的低级库存控制和部件追踪。支持 REST API 和插件系统,易于扩展和集成。
基于 LLM 的多模态智能体框架,用于操作智能手机应用。通过简化动作空间模仿人类交互,如点击和滑动,无需系统后端访问。支持通过自主探索或观察人类演示学习新应用,生成知识库以执行跨应用复杂任务。
极简 PaaS,支持 git push 部署到自有服务器。兼容 ARM/Intel 架构,自动识别 Python/Go/Node/Java/Ruby 等运行时,通过 Procfile 管理进程,支持虚拟主机、SSL 及静态站点。
基于 ICCV 2023 的视频修复工具,结合传播与 Transformer 技术,支持物体移除与视频补全。提供在线演示与高效推理,代码已开源。
ClearML 是一个开源的 MLOps/LLMOps 平台,提供实验管理、数据管理、流水线编排、调度和模型服务的一站式解决方案,支持 CI/CD 自动化,简化 AI 工作流。
通义千问-VL官方仓库,提供视觉语言大模型的预训练与聊天功能。支持Qwen-VL-Plus和Qwen-VL-Max等最新版本,具备高分辨率图像理解、文本识别与视觉推理能力,性能媲美GPT-4V和Gemini Ultra。
为 SSTap 提供更多游戏规则,使其成为真正的网游加速器。支持自定义路由表,包含 GEOIPCN.1 和 GEOIPCN.2 两种源,用户可下载规则包或单个规则导入使用。
开源 CTF 框架,专注于易用性和可定制性。提供完整的 CTF 运行环境,支持插件和主题扩展。包含动态评分、团队竞赛、排行榜、Markdown 内容管理及多种部署方式。