Opzioni di input binario

opzioni di input binario

opzioni di input binario

Databricks Runtime supports the binary file data source, which reads binary files and converts each file into a single record that contains the raw content and metadata of the file.

L'origine dati del file binario produce un frame di dati con le colonne seguenti e possibilmente le colonne di partizione:The binary file data source produces a DataFrame with the following columns and possibly partition columns: Per leggere i file binari, specificare l'origine dati format come binaryFile. To read binary files, specify the data source format as binaryFile.

opzioni di input binario

OpzioniOptions Per caricare i file con percorsi corrispondenti a un criterio glob specificato mantenendo il comportamento dell'individuazione delle partizioni, è possibile usare l' pathGlobFilter opzione. To load files with paths matching a given glob pattern while keeping the behavior of partition discovery, you can use the pathGlobFilter option.

opzioni di input binario

If you want to ignore partition discovery and recursively search files under the input directory, use the recursiveFileLookup option. Nota Per migliorare le prestazioni di lettura quando si caricano i dati, Azure Databricks consiglia di disattivare opzioni di input binario compressione quando si salvano i dati caricati da file binari:To improve read performance when you load data back, Azure Databricks recommends turning off compression when you save data loaded from binary files: spark.

Leggi anche