Menggunakan dask, kita dapat membuka banyak file csv secara sekaligus, untuk contoh percobaan kali ini data saya ambil dari FIRMS NASA. Melalui satelit NPP-Suomi, data hotspot per tahun untuk masing-masing negara dapat diakses melalui link: https://firms.modaps.eosdis.nasa.gov/country/

Unduh Data

Unduh data dari masing-masing tahun menggunakan wget

$ wget https://firms.modaps.eosdis.nasa.gov/data/country/viirs-snpp/2012/viirs-snpp_2012_Indonesia.csv
$ wget https://firms.modaps.eosdis.nasa.gov/data/country/viirs-snpp/2013/viirs-snpp_2013_Indonesia.csv
$ wget https://firms.modaps.eosdis.nasa.gov/data/country/viirs-snpp/2014/viirs-snpp_2014_Indonesia.csv
$ wget https://firms.modaps.eosdis.nasa.gov/data/country/viirs-snpp/2015/viirs-snpp_2015_Indonesia.csv
$ wget https://firms.modaps.eosdis.nasa.gov/data/country/viirs-snpp/2016/viirs-snpp_2016_Indonesia.csv
$ wget https://firms.modaps.eosdis.nasa.gov/data/country/viirs-snpp/2017/viirs-snpp_2017_Indonesia.csv
$ wget https://firms.modaps.eosdis.nasa.gov/data/country/viirs-snpp/2018/viirs-snpp_2018_Indonesia.csv

Jupyter Lab

Menggunakan dask untuk membaca file .csv dengan wildcard

import dask.dataframe as dd
df = dd.read_csv('viirs-snpp_*_Indonesia.csv')

Pilih filter menggunakan syntax DataFrame, memilih data dengan tingkat kepercayaan tinggi, kondisi malam hari, dan tipe kebakaran vegetasi (df.type == 0).

condition = (df.confidence == 'h') & \
    (df.daynight == 'N') & \
    (df.type == 0)

Ambil seluruh data yang sesuai dengan filter condition dan export sebagai satu file .csv

fire = df[condition].copy().reset_index(drop = True)
fire.to_csv('hotspot_indonesia.csv', single_file = True)