本文介紹基于Python語(yǔ)言,逐一讀取大量.nc格式的多時(shí)相柵格文件,導(dǎo)出其中所具有的全部時(shí)間信息的方法~
本文介紹了如何使用Python語(yǔ)言逐一讀取大量的.nc格式的多時(shí)相柵格文件,并導(dǎo)出其中包含的全部時(shí)間信息。
.nc是NetCDF(Network Common Data Form)文件的擴(kuò)展名,表示一種常用的科學(xué)數(shù)據(jù)存儲(chǔ)格式。NetCDF是一種自描述的、可移植的二進(jìn)制文件格式,用于存儲(chǔ)科學(xué)和工程領(lǐng)域的大型數(shù)據(jù)集。由于其自身的特性,.nc數(shù)據(jù)被廣泛應(yīng)用于氣象學(xué)、海洋學(xué)、地球科學(xué)、氣候研究、大氣科學(xué)、地理信息系統(tǒng)等領(lǐng)域。
首先,明確一下本文的需求,F(xiàn)在有一個(gè)文件夾,其中包含大量的.nc格式的柵格文件,如下圖所示。
每一個(gè).nc格式的文件都具有多個(gè)時(shí)相(或者說(shuō)是多個(gè)維度),而不僅僅只是一個(gè)時(shí)相。我們希望讀取這個(gè)文件夾中的全部.nc格式文件,并獲取其所表示的每一個(gè)時(shí)相。
明確了需求后,我們就可以開(kāi)始具體的操作。首先,本文所需用到的代碼如下。
# -*- coding: utf-8 -*-
"""
Created on Sun Dec 31 20:28:03 2023
@author: fkxxgis
"""
import os
import netCDF4
from netCDF4 import Dataset
def list_nc_dates(folder_path):
nc_dates = []
for file_name in os.listdir(folder_path):
if file_name.endswith(".nc"):
file_path = os.path.join(folder_path, file_name)
try:
dataset = Dataset(file_path)
time_var = dataset.variables["time"]
time_values = time_var[:]
time_units = time_var.units
time_calendar = time_var.calendar
dates = []
for value in time_values:
date = netCDF4.num2date(value, units=time_units, calendar=time_calendar)
dates.append(date.strftime("%Y-%m-%d %H:%M:%S"))
nc_dates.append((file_name, dates))
except Exception as e:
print(f"Error reading file {file_name}: {str(e)}")
return nc_dates
folder_path = "F:/Data_Reflectance_Rec/soil_1"
nc_dates = list_nc_dates(folder_path)
for nc_file, dates in nc_dates:
for date in dates:
print(date)
這段代碼整體思路也很明確。
首先,我們導(dǎo)入所需的模塊。在這里,需要導(dǎo)入Python的os模塊,用于處理文件和文件夾路徑操作;同時(shí)導(dǎo)入netCDF4庫(kù),并接著從netCDF4庫(kù)中導(dǎo)入Dataset類,用于打開(kāi)和讀取.nc文件。
接下來(lái),我們定義了一個(gè)名為list_nc_dates的函數(shù),接受一個(gè)文件夾路徑作為參數(shù)。在函數(shù)中,首先創(chuàng)建一個(gè)空列表nc_dates,用于存儲(chǔ)每個(gè).nc文件及其對(duì)應(yīng)的日期列表;隨后,使用os.listdir()函數(shù)遍歷文件夾中的所有文件,通過(guò)檢查文件名是否以.nc結(jié)尾來(lái)篩選出.nc文件。緊接著,對(duì)于篩選出來(lái)的.nc文件,使用os.path.join()函數(shù)構(gòu)建其完整路徑。
其次,使用Dataset類打開(kāi).nc文件,并將打開(kāi)的文件對(duì)象賦值給dataset變量;隨后,獲取.nc文件的時(shí)間,在本文的.nc數(shù)據(jù)中,也就是名為time的變量,并將時(shí)間變量的值讀取到time_values變量中。接下來(lái),分別獲取時(shí)間變量的單位與時(shí)間類型。
隨后,我們創(chuàng)建一個(gè)空列表dates,用于存儲(chǔ)日期字符串。遍歷時(shí)間變量的每個(gè)值,使用netCDF4.num2date()函數(shù)將時(shí)間值轉(zhuǎn)換為日期對(duì)象。緊接著,將日期對(duì)象轉(zhuǎn)換為指定格式的字符串,并將其添加到dates列表中。此外,這里還將.nc文件名和對(duì)應(yīng)的日期列表作為元組添加到nc_dates列表中,方便我們后期對(duì)日期的核對(duì)。函數(shù)的最后,返回包含每個(gè).nc文件及其對(duì)應(yīng)日期的列表。
在函數(shù)外部,我們?cè)O(shè)置文件夾路徑,隨后即可調(diào)用list_nc_dates函數(shù),將文件夾路徑傳遞給它,并將返回的結(jié)果賦值給nc_dates變量。最后,通過(guò)循環(huán),打印每個(gè)日期即可。
執(zhí)行上述代碼,即可出現(xiàn)如下圖所示的結(jié)果(結(jié)果很長(zhǎng),就截取一部分)。由于在本文中,每一個(gè).nc格式文件的每一個(gè)維度(即每一個(gè)時(shí)相)都是精確到天的,所以下圖天數(shù)后的時(shí)、分、秒都是00。當(dāng)然,如果大家的.nc格式文件維度很多,時(shí)相打印出來(lái)的話也不好完全顯示,所以可以考慮將時(shí)間信息導(dǎo)出為表格文件等;例如,可以將每一個(gè)date都放在DataFrame中,隨后導(dǎo)出為.csv文件。
至此,大功告成。
小編推薦閱讀如何使用 Pytorch 中的 DataSet 和 DataLoader
閱讀golang slice相關(guān)常見(jiàn)的性能優(yōu)化手段
閱讀連接Elasticsearch服務(wù)器的Python代碼示例
閱讀國(guó)產(chǎn)操作系統(tǒng)上實(shí)現(xiàn)RTMP推流攝像頭視頻和麥克風(fēng)聲音到流媒體服務(wù)器
閱讀使用Python讀取和導(dǎo)出NetCDF格式的多時(shí)相柵格文件
閱讀多租戶系統(tǒng)數(shù)據(jù)權(quán)限設(shè)計(jì)與RuoYi系統(tǒng)的借鑒
閱讀count(*)、count(1)哪個(gè)更快?面試必問(wèn):通宵整理的十道經(jīng)典MySQL必問(wèn)面試題
閱讀從需求分析、產(chǎn)品設(shè)計(jì)到部署交付各階段說(shuō)明
閱讀如何利用七牛云進(jìn)行數(shù)據(jù)備份和刪除
閱讀強(qiáng)化學(xué)習(xí)筆記之【ACE:Off-PolicyActor-CriticwithCausality-AwareEntropyRegularization】
閱讀使用MailKit在.NET Core中收發(fā)郵件的完整示例
閱讀WiFi基礎(chǔ)(六):天線基礎(chǔ)知識(shí)
閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請(qǐng)發(fā)郵件[email protected]
湘ICP備2022002427號(hào)-10 湘公網(wǎng)安備:43070202000427號(hào)© 2013~2024 haote.com 好特網(wǎng)