在 GitHub 上编辑

使用 DVC 命令

新功能! DVC 现已支持 VS Code 集成开发环境,将大量 DVC 操作添加到了 命令面板中。

DVC 的核心是一个命令行工具。这些页面包含了 dvc 命令的详细说明、独立描述以及全面的使用示例。运行 dvc -h 可列出所有命令。

若要在特定目录中运行 DVC,请在命令及其选项/参数前使用 dvc --cd <路径> ...(不会更改终端中的当前目录)。

典型的 DVC 工作流

  • 在 Git 仓库中使用 dvc init 初始化一个DVC 项目
  • 将用于建模的数据文件或数据集目录复制到项目中,并使用 dvc add 告诉 DVC 对其进行缓存和追踪。
  • 创建一个简单的 dvc.yaml 文件,以将数据处理流水线代码化。该文件使用你自己的源代码,并指定需要 DVC 管理的更多数据输出
  • 使用 dvc repro 执行或恢复流水线的任意版本,或使用 dvc exp 功能对其进行实验。
  • 共享仓库时不会包含本地缓存的数据。请配合使用远程存储dvc pushdvc pull 来共享数据产物。
内容

🐛 发现问题?告诉我们!或者修复它:

在 GitHub 上编辑

有疑问?加入我们的聊天,我们会为您提供帮助:

Discord 聊天