

郵件訂閱
基于全球開源DEM的高程誤差預(yù)測(cè)數(shù)據(jù)集說(shuō)明
數(shù)據(jù)主編:中山大學(xué)王青松副教授團(tuán)隊(duì)
一、數(shù)據(jù)集下載
科學(xué)數(shù)據(jù)銀行(Science-DB):
https://www.scidb.cn/detail?dataSetId=4ff64711ec274577a2d30716ede7bcd1
二、數(shù)據(jù)集介紹
DEEP-Dataset(DEM Elevation Error Prediction Dataset, DEM高程誤差預(yù)測(cè)數(shù)據(jù)集)是利用地形特征因子與高程誤差的關(guān)聯(lián)關(guān)系建立DEM高程誤差預(yù)測(cè)模型的數(shù)據(jù)集。該數(shù)據(jù)集包括四個(gè)子數(shù)據(jù)集,分別基于中國(guó)廣東省研究區(qū)域的TanDEM-X DEM和AW3D30 DEM以及澳大利亞北領(lǐng)地研究區(qū)域的SRTM DEM和ASTER DEM構(gòu)成。其中,廣東省研究區(qū)域的樣本數(shù)量約為40,000,北領(lǐng)地研究區(qū)域的樣本數(shù)約量為1,600,000。數(shù)據(jù)集中的每個(gè)樣本均由10個(gè)特征組成,涵蓋了地理空間、地物種類以及地表形態(tài)等特征信息。
SRTM DEM是2000年由航天飛機(jī)InSAR系統(tǒng)測(cè)量獲得的全球數(shù)字高程模型,由美國(guó)國(guó)家測(cè)繪局和美國(guó)太空總署(NASA)發(fā)布,并經(jīng)過多次修訂和優(yōu)化,其高程精度LE90(Linear Error at 90%)優(yōu)于16米。ASTER GDEM是由先進(jìn)星載熱發(fā)射和反射輻射儀測(cè)量獲得的全球數(shù)字高程模型,由日本和美國(guó)NASA合作開發(fā)并免費(fèi)提供,高程精度LE95(Linear Error at 95%)優(yōu)于20米。TanDEM-X DEM數(shù)據(jù)由TerraSAR-X和TanDem-X衛(wèi)星組成的雙星系統(tǒng)對(duì)地干涉測(cè)量得到。它涵蓋了從南極到北極的所有地球陸地區(qū)域,高程精度LE90優(yōu)于4米。AW3D30 DEM數(shù)據(jù)由日本太空發(fā)展署研制的ALOS(Advanced Land Observing Satellite)衛(wèi)星搭載的全色立體測(cè)繪遙感儀儀器拍攝的立體影像制作,均方根誤差(Root Mean Squard Error,RMSE)優(yōu)于5米。ICESat-2即冰、云和陸地高程衛(wèi)星,其搭載了先進(jìn)的地形激光測(cè)高系統(tǒng)。ICESat-2 平面精度RMSE優(yōu)于6.5 m,高程精度RMSE約為0.1 m。自產(chǎn)品發(fā)布以來(lái),ATL08陸地高程數(shù)據(jù)被廣泛應(yīng)用于DEM誤差校正和精度評(píng)定,因此在本文中作為參考數(shù)據(jù)。需要說(shuō)明的是由于不同來(lái)源DEM的高程基準(zhǔn)和精度指標(biāo)定義方式存在差異,本文遵循各全球開源DEM用戶手冊(cè)中的精度指標(biāo)定義方式。在開源DEM實(shí)際使用過程中,用戶體驗(yàn)的產(chǎn)品精度往往優(yōu)于用戶手冊(cè)給出的精度。DEM數(shù)據(jù)產(chǎn)品的詳細(xì)信息介紹如表1所示。
表1 DEM和ICESat-2產(chǎn)品基本屬性介紹
DEM | 傳感器類型 | 空間分辨率 | 坐標(biāo)系 | 覆蓋范圍 |
SRTM | 雷達(dá) | 30 m | WGS84 | 56°S~60°N |
ASTER | 光學(xué) | 30 m | WGS84 | 83°S~83°N |
TanDEM-X | 雷達(dá) | 30 m | WGS84 | 90°S~90°N |
AW3D30 | 光學(xué) | 30 m | WGS84 | 84°S~84°N |
ICESat-2 | 激光 | \ | WGS84 | 88°S~88°N |
本文的兩個(gè)研究區(qū)域分別為中國(guó)廣東省和澳大利亞北領(lǐng)地。如下圖1和2所示。
圖1 廣東省區(qū)域內(nèi)ICESat-2控制點(diǎn)分布、TanDEM-X DEM和AW3D30 DEM
圖2 澳大利亞北領(lǐng)地區(qū)域內(nèi)ICESat-2控制點(diǎn)分布、SRTM DEM和ASTER DEM
DEEP-Dataset構(gòu)建流程包括四個(gè)部分:數(shù)據(jù)預(yù)處理、特征構(gòu)建、目標(biāo)變量構(gòu)建以及數(shù)據(jù)集評(píng)估,流程如圖3所示。
圖3 DEEP-Dataset構(gòu)建流程圖
DEEP-Dataset的構(gòu)建遵循以下步驟。首先,確認(rèn)研究區(qū)域,并獲取與該區(qū)域相關(guān)的DEM產(chǎn)品,以及相應(yīng)的高精度控制點(diǎn)數(shù)據(jù);然后,對(duì)采集到的DEM數(shù)據(jù)進(jìn)行統(tǒng)一高程基準(zhǔn)處理,對(duì)ICESat-2控制點(diǎn)數(shù)據(jù)進(jìn)行異常值篩選和濾除處理;其次,將篩選后的控制點(diǎn)數(shù)據(jù)的經(jīng)緯度坐標(biāo)讀取到表格中作為數(shù)據(jù)集地理空間特征,再提取對(duì)應(yīng)位置DEM的地物覆蓋數(shù)據(jù)和地形因子等作為數(shù)據(jù)集地物種類特征以及地表形態(tài)特征;接著,計(jì)算控制點(diǎn)和DEM產(chǎn)品之間的高程誤差值作為目標(biāo)變量,構(gòu)建成以控制點(diǎn)經(jīng)緯度坐標(biāo)為索引的表格數(shù)據(jù)集,其中表格中一行代表一個(gè)樣本點(diǎn),包含10種特征和1個(gè)目標(biāo)變量;最后,對(duì)構(gòu)建好的數(shù)據(jù)集采用K-折交叉驗(yàn)證方法在多種先進(jìn)的機(jī)器學(xué)習(xí)方法上進(jìn)行驗(yàn)證和評(píng)估,并根據(jù)實(shí)驗(yàn)結(jié)果對(duì)評(píng)估后的數(shù)據(jù)集進(jìn)行多次調(diào)整,從而得到更合理、更豐富和更有效的數(shù)據(jù)集。
表2介紹了DEEP-Dataset的四個(gè)子數(shù)據(jù)集研究區(qū)域的基本情況,DEM產(chǎn)品,樣本數(shù)量,特征屬性以及目標(biāo)變量等。
表2 DEEP-Dataset介紹
研究區(qū)域 | 面積(km2) | 地形特點(diǎn) | DEM | 樣本數(shù)量 | 特征屬性 | 目標(biāo)變量 |
中國(guó)廣東省 | 179 725 | 高山、丘陵、臺(tái)地和平原 | TanDEM-X | 18 415 | 經(jīng)度、緯度、地物種類、坡度、坡向、坡位、地形起伏度、地表粗糙度、坡度變率、坡向變率 | 高程誤差 |
AW3D30 | 18 439 | |||||
澳大利亞北領(lǐng)地 | 1 420 968 | 平原、高原、山地和沙漠 | SRTM | 795 391 | ||
ASTER | 795 495 |
三、使用聲明
若在論文、學(xué)術(shù)報(bào)告中使用該數(shù)據(jù)集,請(qǐng)引用以下數(shù)據(jù)論文文獻(xiàn):
引用本文: 余翠琳, 王青松, 鐘梓炫, 張君豪, 賴濤, 黃海風(fēng). 利用全球開源數(shù)字高程模型的高程誤差預(yù)測(cè)數(shù)據(jù)集[J]. 電子與信息學(xué)報(bào), 2024, 46(9): 3445-3455. doi: 10.11999/JEIT240062
Citation: YU Cuilin, WANG Qingsong, ZHONG Zixuan, ZHANG Junhao, LAI Tao, HUANG Haifeng. Elevation Error Prediction Dataset Using Global Open-source Digital Elevation Model[J]. Journal of Electronics & Information Technology, 2024, 46(9): 3445-3455. doi: 10.11999/JEIT240062
論文鏈接:http://www.sharego.top/cn/article/doi/10.11999/JEIT240062
請(qǐng)關(guān)注公眾號(hào),獲取驗(yàn)證碼后下載