Warm tip: This article is reproduced from serverfault.com, please click

pyspark-Azure Databricks:如何使用python删除DBFS外部特定扩展名的文件

(pyspark - Azure Databricks: How to delete files of a particular extension outside of DBFS using python)

发布于 2020-12-03 13:01:25

我可以使用databricks中的bash命令从目录/ databricks / driver删除特定扩展名的文件

%%bash

rm /databricks/driver/file*.xlsx

但是我不知道如何在python脚本中访问和删除dbfs之外的文件,

我认为使用dbutils我们无法访问DBFS之外的文件,并且下面的命令输出False作为它在DBFS中的外观。

dbutils.fs.rm("/databricks/driver/file*.xlsx")

我渴望得到纠正。

Questioner
Somu Sinhhaa
Viewed
0
Somu Sinhhaa 2020-12-07 17:24:02

不知道如何使用dbutils进行操作,但是我可以使用glob将其删除

import os
from glob import glob

for file in glob('/databricks/driver/file*.xlsx'):
  os.remove(file)