在 GitHub 上编辑
项目结构
在你的 工作区 中使用 dvc init
将初始化一个 DVC 项目,包括内部的 .dvc/
目录。此后,你将创建并管理不同的 DVC 元文件(如下所示),并在进行机器学习实验时向 缓存 中填充数据产物。
-
dvc.yaml
文件定义了阶段、参数、指标和图表。阶段构成了项目的流水线。参数、指标和图表用于评估和比较项目版本,可以在阶段内或独立定义。 -
.dvc
文件(“点 DVC 文件”)是用于跟踪数据文件和目录的占位符。 -
.dvcignore
文件(可选)包含 DVC 应忽略的路径列表,这可以显著提升其操作性能。
这些元文件通常通过 Git 进行版本控制,因为 DVC 并不取代 Git 的分布式版本控制功能,而是对其进行扩展。