在 GitHub 上编辑

项目结构

在你的 工作区 中使用 dvc init 将初始化一个 DVC 项目,包括内部的 .dvc/ 目录。此后,你将创建并管理不同的 DVC 元文件(如下所示),并在进行机器学习实验时向 缓存 中填充数据产物。

  • dvc.yaml 文件定义了阶段、参数、指标和图表。阶段构成了项目的流水线。参数、指标和图表用于评估和比较项目版本,可以在阶段内或独立定义。

  • .dvc 文件(“点 DVC 文件”)是用于跟踪数据文件和目录的占位符。

  • .dvcignore 文件(可选)包含 DVC 应忽略的路径列表,这可以显著提升其操作性能。

  • .dvc/ 内部的文件和目录包含本地 配置 文件、默认的本地缓存位置以及其他 DVC 运行所需的工具。

这些元文件通常通过 Git 进行版本控制,因为 DVC 并不取代 Git 的分布式版本控制功能,而是对其进行扩展。

🐛 发现问题?告诉我们!或者修复它:

在 GitHub 上编辑

有疑问?加入我们的聊天,我们会为您提供帮助:

Discord 聊天