Pandas资源
探索与 Pandas 相关的精选开源项目、速读教程和最新工作机会
相关开源项目
modin-project/modin
通过更改一行代码即可扩展 Pandas 工作流,利用多核加速数据处理,尤其适用于大型数据集,提供无缝的 API 替代。
rapidsai/cudf
GPU 加速的 DataFrame 库,用于表格数据处理。支持 pandas API、Polars GPU 引擎及 Dask 后端,提供零代码变更加速器 cudf.pandas。
saulpw/visidata
终端电子表格多工具,用于发现和整理数据。支持 tsv、csv、sqlite、json、xlsx、hdf5 等多种格式。基于 Python,可在 Linux、OS/X、Windows (WSL) 上运行。
《利用Python进行数据分析·第2版》的中文版仓库,包含书籍代码、学习笔记与勘误。提供第3版的升级内容与学习资源,以及相关书籍《Polars权威指南》的推荐。
tabulapdf/tabula
从 PDF 文件中提取表格数据的工具,支持文本型 PDF,通过 Web 界面导出 CSV。
evidentlyai/evidently
开源 ML 和 LLM 可观测性框架。评估、测试和监控任何 AI 系统或数据管道。支持表格和文本数据。提供 100+ 内置指标。支持离线评估和实时监控。
codebasics/py
为 Python 初学者提供大量示例程序,涵盖多种算法,帮助学习编程。
jspreadsheet/ce
轻量级JavaScript数据网格组件,提供类似Excel的交互式电子表格功能。支持复杂数据输入、Excel兼容操作及第三方插件集成,适用于ERP、教育、物流等多种场景。
ibis-project/ibis
便携式 Python dataframe 库,支持超过 20 个后端。提供快速本地处理(默认 DuckDB)、惰性表达式和交互式探索模式。可混合 Python 与 SQL 代码,通过单行代码切换本地与远程部署。
pixie-io/pixie
基于 eBPF 的 Kubernetes 原生可观测性工具,自动收集全链路数据,支持集群内边缘计算,脚本化查询。适用于网络监控、基础设施健康、服务性能与数据库查询分析。
onlyoffice/documentserver
免费协作在线办公套件,支持文本、电子表格、演示文稿、表单和 PDF 编辑器,完全兼容 Office Open XML 格式,提供实时协作编辑功能。
nissl-lab/npoi
无需安装 Microsoft Office 即可读写 Office 文件的 .NET 库。支持 Excel 2003/2007 格式,完全免费,跨平台运行。
ldqk/masuit.tools
全龄段友好的C#万能工具库,包含加密解密、反射、权重随机、分布式短ID、表达式树、LINQ扩展、文件压缩、多线程下载、硬件信息、字符串扩展、日期时间、中国农历、大文件拷贝、图像裁剪、验证码、断点续传、集合扩展、Excel导出等常用封装,代码量不到2MB。
tealeg/xlsx
Go 语言库,用于读写 Microsoft Excel XLSX 文件。已迁移至 codeberg,v4 版本。支持流式处理和自定义数据存储。
apache/fesod
高性能、内存友好的 Java 电子表格处理库。支持流式读写,轻松应对大文件,避免 OOM。API 简洁易用,专为快速开发设计。
biolab/orange3
Orange 是一款交互式数据挖掘与可视化工具箱,无需编程或深厚数学知识即可探索数据。它通过工作流驱动,隐藏复杂底层机制,让数据科学更易上手。
closedxml/closedxml
基于 .NET 的开源库,用于读取、操作和写入 Excel 2007+ (.xlsx, .xlsm) 文件。提供直观的 API 接口,简化 OpenXML 底层操作,支持创建、编辑和保存 Excel 报表。
501351981/vue-office
支持 word、excel、pdf、pptx 等多种 Office 文件在线预览的 Vue 组件库,兼容 Vue 2/3 及非 Vue 框架。提供一站式预览方案,只需传入文件地址或二进制数据即可使用,性能优化良好。
lux-org/lux
通过单次打印自动生成 pandas DataFrame 可视化,利用交互式组件快速探索数据模式与趋势。
datawhalechina/joyful-pandas
基于 pandas 的中文教程,提供 Jupyter Notebook 形式的学习资料。包含从基础到高级的章节,如数据可视化、特征工程和性能优化,并配有大量练习题。纸质版已出版,网页版可在线访问。
man-group/dtale
基于 Flask 和 React 的可视化工具,用于查看和分析 Pandas 数据结构。支持 DataFrame、Series 等对象,无缝集成 Jupyter Notebook 和终端。提供交互式图表、网络分析和实时演示。
geopandas/geopandas
基于 pandas 扩展的 Python 库,用于处理地理空间数据。提供 GeoSeries 和 GeoDataFrame 类型,支持几何操作与坐标参考系统管理。
javascriptdata/danfojs
开源 JavaScript 数据分析库,受 Pandas 启发,提供高性能、直观的数据结构。支持 Tensorflow.js 张量、缺失数据处理、灵活分组、数据合并与 IO 工具,适用于 Node.js 和浏览器环境。
xlwings/xlwings
Python 库,轻松实现 Excel 与 Python 互调。支持 Windows、macOS、Google Sheets 和 Excel 网页版。提供脚本、宏和 UDF 功能,完美支持 Numpy 和 Pandas。