在 GitHub 上编辑

如何添加依赖项或输出

要向阶段添加依赖项输出项,请编辑dvc.yaml文件(手动编辑或使用带-f标志的dvc stage add)。准备就绪后,dvc repro将执行该阶段并缓存输出文件。

如果该阶段已经执行过,并且所需的输出已存在于工作区中,则可以避免使用dvc repro(这可能开销较大且不必要),而改用dvc commit

请注意,这两种方式都会同时更新dvc.lock

示例

我们从一个示例prepare阶段开始,该阶段具有单个依赖项和输出项。为了添加缺失的依赖项(data/raw.csv)以及缺失的输出项(data/validate),我们可以这样编辑dvc.yaml

 stages:
   prepare:
     cmd: python src/prepare.py
     deps:
+    - data/raw.csv
     - src/prepare.py
     outs:
     - data/train
+    - data/validate

我们也可以使用带-f参数的dvc stage add为该阶段添加另一个依赖项或输出项:

$ dvc stage add -n prepare \
          -f \
          -d src/prepare.py \
          -d data/raw.csv \
          -o data/train \
          -o data/validate \
          python src/prepare.py data/raw.csv

-f会覆盖dvc.yaml中的阶段。

如果data/raw.csvdata/validate文件已经存在,我们可以使用dvc commit来缓存新指定的输出项(并更新dvc.lock中的depsouts文件哈希值):

$ dvc commit
内容

🐛 发现问题?告诉我们!或者修复它:

在 GitHub 上编辑

有疑问?加入我们的聊天,我们会为您提供帮助:

Discord 聊天