From 孫利民 尚志強
原載于《橋梁》雜志2018年第4期
結(jié)構(gòu)健康監(jiān)測技術(shù)被廣泛應(yīng)用于大型橋梁的養(yǎng)護(hù)管理,但受數(shù)據(jù)分析方法和計算方式的限制,橋梁結(jié)構(gòu)健康監(jiān)測系統(tǒng)所積累的海量監(jiān)測數(shù)據(jù)并未得到有效利用。近幾年,大數(shù)據(jù)技術(shù)的發(fā)展為橋梁結(jié)構(gòu)健康監(jiān)測數(shù)據(jù)的有效利用帶來了希望。大數(shù)據(jù)可視化分析是大數(shù)據(jù)分析的一個分支,能夠?qū)崿F(xiàn)高維數(shù)據(jù)可視化的同時,識別數(shù)據(jù)中的模式。
在傳統(tǒng)的橋梁養(yǎng)護(hù)管理中,基于人工檢測的結(jié)構(gòu)狀態(tài)評估扮演了重要角色,然而人工檢測工作量大、主觀性強,難以實現(xiàn)對結(jié)構(gòu)性能的長期定量跟蹤。近年來,結(jié)構(gòu)健康監(jiān)測技術(shù)(Structural Health Monitoring, SHM)在大跨橋梁的養(yǎng)護(hù)管理中得到廣泛應(yīng)用。橋梁結(jié)構(gòu)健康監(jiān)測通過在結(jié)構(gòu)上安裝傳感器,以實時獲取橋址環(huán)境和結(jié)構(gòu)響應(yīng)的信息,并基于這些信息對橋梁的技術(shù)狀態(tài)做出實時、自動的評估甚至安全預(yù)警。我國當(dāng)前至少有240多座大跨度橋梁安裝了結(jié)構(gòu)健康監(jiān)測系統(tǒng)(Structural Health Monitoring System, SHMS),經(jīng)過長期的觀測,這些監(jiān)測系統(tǒng)積累了大量的數(shù)據(jù),基于這些數(shù)據(jù)有效解讀結(jié)構(gòu)的狀態(tài)、識別可能的損傷,成為目前SHM研究的關(guān)鍵問題。
利用SHM數(shù)據(jù)進(jìn)行結(jié)構(gòu)狀態(tài)評估和損傷識別有“基于模型”和“數(shù)據(jù)驅(qū)動”兩類方法?;谀P偷姆椒ū举|(zhì)上是橋梁結(jié)構(gòu)有限元建模、模型修正、系統(tǒng)參數(shù)反演的過程,對理論模型的精度和監(jiān)測數(shù)據(jù)的質(zhì)量有很高的要求,目前在實際工程中應(yīng)用效果還不理想。數(shù)據(jù)驅(qū)動的方法關(guān)注監(jiān)測所得到的輸入和輸出數(shù)據(jù)相關(guān)關(guān)系的變化規(guī)律,以識別結(jié)構(gòu)狀態(tài)所對應(yīng)的模式,借助于成熟的統(tǒng)計學(xué)理論,數(shù)據(jù)驅(qū)動方法在SHM中得到廣泛應(yīng)用。但傳統(tǒng)的統(tǒng)計方法由于計算能力和分析手段的限制,只能分析少部分、低維度的數(shù)據(jù)樣本,且無法高效地呈現(xiàn)分析結(jié)果,因此尚不足以解決海量、高維SHM數(shù)據(jù)的分析問題。
大數(shù)據(jù)技術(shù)是近幾年的新興技術(shù),已在互聯(lián)網(wǎng)、電子商務(wù)、醫(yī)學(xué)等領(lǐng)域得到廣泛應(yīng)用,改善了計算能力不足、數(shù)據(jù)分析方法低效等問題,在SHM的數(shù)據(jù)處理上也展現(xiàn)出廣闊的應(yīng)用前景。大數(shù)據(jù)可視化分析是大數(shù)據(jù)分析的一個重要分支,該方法將人所具備的、機器并不擅長的認(rèn)知能力融入到分析過程中,可提升數(shù)據(jù)分析的效率和準(zhǔn)確性,并可對高維數(shù)據(jù)進(jìn)行直觀的呈現(xiàn)。
“大數(shù)據(jù)”概念首次提出于1996年,2008年《Nature》雜志推出大數(shù)據(jù)專欄,2011年麥肯錫公司的研究報告對大數(shù)據(jù)的關(guān)鍵技術(shù)和應(yīng)用領(lǐng)域等進(jìn)行了全面的分析總結(jié),大數(shù)據(jù)逐漸為各行各業(yè)所關(guān)注?!按髷?shù)據(jù)”的內(nèi)涵和外延在不斷地被豐富,在不同的文獻(xiàn)中,“大數(shù)據(jù)”被描述為數(shù)據(jù)集、可實現(xiàn)的功能、數(shù)據(jù)變現(xiàn)過程、架構(gòu)和技術(shù)等。大數(shù)據(jù)應(yīng)該從數(shù)據(jù)集特征、思維方式、技術(shù)三個方面進(jìn)行理解(圖1)。
一般認(rèn)為,大數(shù)據(jù)具備4V特征,即數(shù)據(jù)體量大(Volume)、種類多(Variety)、增速快(Velocity)、價值密度低(Value)。4V特征并沒有明確地限定大數(shù)據(jù)的體量規(guī)模,因而可廣泛適用于各個行業(yè)。
大數(shù)據(jù)分析應(yīng)具備的三個思維方式,即“使用全體數(shù)據(jù)進(jìn)行分析”“接受數(shù)據(jù)混雜性,數(shù)據(jù)量大彌補質(zhì)量差”“追求相關(guān)關(guān)系而非因果關(guān)系”。因而具有以下特點:與傳統(tǒng)統(tǒng)計分析只使用一小部分隨機抽樣數(shù)據(jù)相比,使用全體數(shù)據(jù)可以發(fā)現(xiàn)更多的細(xì)節(jié)和有價值的信息;接受數(shù)據(jù)混雜、增大數(shù)據(jù)量能夠簡化分析模型并避免過擬合,從而獲得更準(zhǔn)確的分析結(jié)果;從相關(guān)關(guān)系切入則可為數(shù)據(jù)分析提供新的視角。當(dāng)前大數(shù)據(jù)處理技術(shù)已使得分析所有數(shù)據(jù)成為可能,通過大數(shù)據(jù)分析挖掘相關(guān)關(guān)系也取得了許多成功應(yīng)用;但以數(shù)據(jù)量大彌補質(zhì)量差時,如果全部數(shù)據(jù)中的噪聲多于信號則信號易被掩蓋,因此不能盲目收入所有數(shù)據(jù),仍需尋找與分析目的強相關(guān)的數(shù)據(jù)。
大數(shù)據(jù)的技術(shù)主要體現(xiàn)在數(shù)據(jù)采集、存儲、計算處理、分析方法等幾個方面。大數(shù)據(jù)的采集、存儲、計算等多以軟件工具的方式呈現(xiàn),如用于獲取數(shù)據(jù)的物聯(lián)網(wǎng)、互聯(lián)網(wǎng),用以存儲數(shù)據(jù)的Hadoop分布式文件系統(tǒng)、NoSQL數(shù)據(jù)庫,用于數(shù)據(jù)計算的Hadoop生態(tài)圈、MapReduce、Spark、Storm、云計算等。大數(shù)據(jù)分析方法涵蓋以各種術(shù)語所表示的數(shù)據(jù)分析方法,包括數(shù)據(jù)庫知識發(fā)現(xiàn)(KDD)、數(shù)據(jù)挖掘、機器學(xué)習(xí)、模式識別、統(tǒng)計學(xué)等。這些術(shù)語雖然在應(yīng)用領(lǐng)域和關(guān)注點上有所不同,但當(dāng)前在大數(shù)據(jù)語境下,其間的差別可不必考究。
與大數(shù)據(jù)分析方法有關(guān)的另一個術(shù)語是人工智能,它是一個宏大的概念,它的提出遠(yuǎn)早于大數(shù)據(jù)。人工智能與大數(shù)據(jù)分析的主要區(qū)別是目標(biāo)上的不同,前者是產(chǎn)生具有智能行為的東西,后者則用以發(fā)現(xiàn)數(shù)據(jù)中隱藏的知識。但二者都要靠大數(shù)據(jù)實體的支撐實現(xiàn),且可以共用分析方法。當(dāng)前人工智能的代表技術(shù)是深度學(xué)習(xí),屬于機器學(xué)習(xí)的一個子集,由于在圖片、語音等識別問題中的出色性能,常脫離于機器學(xué)習(xí)被突出強調(diào)。
KDD、數(shù)據(jù)挖掘等同于機器學(xué)習(xí),貫穿于大數(shù)據(jù)分析的整個流程,模式識別是其中的一個環(huán)節(jié)。大數(shù)據(jù)分析流程在KDD流程的基礎(chǔ)上得到完善,強調(diào)了多源異構(gòu)數(shù)據(jù)融合和特征提取的重要性,最終可由數(shù)據(jù)預(yù)處理、數(shù)據(jù)融合、特征工程、模式識別、可視化等環(huán)節(jié)構(gòu)成。但應(yīng)該注意到,這幾個步驟之間的順序并非絕對的一成不變,且有可能在某一步實現(xiàn)多個功能。
數(shù)據(jù)可視化在大數(shù)據(jù)分析流程中的功能是呈現(xiàn)數(shù)據(jù)分析的結(jié)果,當(dāng)被直接用于探索數(shù)據(jù)、挖掘數(shù)據(jù)中的模式時也被稱為大數(shù)據(jù)可視化分析。大數(shù)據(jù)的一個特征是數(shù)據(jù)種類多,在數(shù)據(jù)集中表現(xiàn)為數(shù)據(jù)的維度高。高維數(shù)據(jù)難以有效地可視化,且會引起數(shù)據(jù)分析中的維度災(zāi)難問題,即數(shù)據(jù)集在高維空間中分布稀疏,缺乏足夠的數(shù)據(jù)構(gòu)建模型。傳統(tǒng)數(shù)據(jù)分析常以降維的方式減少數(shù)據(jù)集中的變量數(shù),由此也會帶來原始數(shù)據(jù)集中信息量的減少。大數(shù)據(jù)可視化分析為有效地呈現(xiàn)、分析高維數(shù)據(jù)提供了新的思路,在SHM的模式識別問題中也展現(xiàn)出應(yīng)用的潛力。
平行坐標(biāo)圖法(parallel coordinate plot, PCP)、t分布隨機鄰域嵌入法(t-SNE)是當(dāng)前高維數(shù)據(jù)可視化中常用的兩種方法。t-SNE在高維空間中構(gòu)建每個數(shù)據(jù)點對其近鄰的概率分布,并在低維空間中重構(gòu)該概率分布,通過最小化兩個概率分布間的差距,以保證高維空間中的數(shù)據(jù)點在低維空間中具有相近的局部結(jié)構(gòu),最終將結(jié)果顯示于二維或三維坐標(biāo)圖上。t-SNE雖然能有效探知原始數(shù)據(jù)的結(jié)構(gòu)和分布,但需要很高的計算開銷。與t-SNE相比,PCP不需要對原始數(shù)據(jù)進(jìn)行降維顯示,且具有更高的可視化效率。PCP通過N個平行坐標(biāo)軸將N維數(shù)據(jù)投射到二維空間中,每個數(shù)據(jù)點被表示為PCP中的一條線段,由此原始的高維數(shù)據(jù)集可被表示為一個幾何系統(tǒng)。PCP能夠呈現(xiàn)數(shù)據(jù)間的相關(guān)關(guān)系,因而具有模式識別功能,這也體現(xiàn)了大數(shù)據(jù)“追求相關(guān)關(guān)系而非因果關(guān)系”的思維方式。PCP的模式識別功能由三個重要的可視化特征實現(xiàn),分別為以下幾方面——
線段夾角,表明變量間的正負(fù)相關(guān)關(guān)系,圖3(a)中線段交匯于一點,表示兩變量間具有強負(fù)相關(guān)關(guān)系,圖3(c)中線段彼此平行,表示兩個變量間具有強正相關(guān)關(guān)系。
線段交點區(qū)域,表明變量間相關(guān)關(guān)系的強弱,圖3(b)線段交匯于一個區(qū)域,表示兩變量間具有弱負(fù)相關(guān)關(guān)系。
線段分布,表明趨勢模式或異常點模式。趨勢模式對應(yīng)密集區(qū)域的線段,異常點則是稀疏區(qū)域的線段。圖3(d)下方的線段可判斷為趨勢,上方的線段為異常點。
PCP用于大數(shù)據(jù)集時,線段數(shù)量的增多會造成線段間的重疊、遮擋(圖4),從而掩蓋坐標(biāo)圖中的可視化特征。為消除線段重疊、減少視覺混雜,學(xué)者們提出了各種改進(jìn)的PCP方法?;贏lpha混合的PCP方法較早地被提出,其將PCP中的每條線段賦予較低的透明度,使線段稀疏部分的顏色被淡化、線段密集區(qū)域的顏色被加深。此種方法的缺陷是透明度值存在下限,不能擴展到更大規(guī)模的數(shù)據(jù)集中。基于分布直方圖的PCP方法(圖10)按每兩個變量計算二維分布直方圖,以直方圖中的每一格表示坐標(biāo)圖中的一條線段,并按直方圖的頻率值設(shè)定線段的透明度。由于能在大幅減少線段數(shù)量的同時,保留PCP中的可視化特征,基于分布直方圖的方法可被擴展到更大規(guī)模的數(shù)據(jù)集。除此之外,PCP中減少視覺混雜的方法還有基于捆扎的方法、基于聚類的方法、基于刷的方法等。
橋梁SHM的監(jiān)測內(nèi)容主要包括環(huán)境運營荷載與結(jié)構(gòu)響應(yīng)兩類,環(huán)境與運營荷載的監(jiān)測項有溫度、降水量、空氣濕度、風(fēng)荷載、交通荷載、地震輸入等;結(jié)構(gòu)響應(yīng)監(jiān)測項有幾何變形和位移、加速度、應(yīng)變、轉(zhuǎn)角、索力等。基于SHM數(shù)據(jù)首先可以進(jìn)行結(jié)構(gòu)損傷或異常識別,但在實際橋梁中這還很難理想實現(xiàn),一是因為當(dāng)前國內(nèi)安裝有SHMS的大部分橋梁服役時間較短,尚未出現(xiàn)明顯的損傷和退化;二是受傳感技術(shù)和數(shù)據(jù)分析方法的限制,結(jié)構(gòu)初期的微小損傷難以被識別。進(jìn)行結(jié)構(gòu)狀態(tài)評估是SHM的主要目的之一,對于服役初期階段尚無明顯損傷的新結(jié)構(gòu),SHM數(shù)據(jù)可用于分析正常環(huán)境與運營荷載下的結(jié)構(gòu)響應(yīng)規(guī)律,從而定義結(jié)構(gòu)的正常狀態(tài),并分析結(jié)構(gòu)狀態(tài)發(fā)生偏離的原因。與結(jié)構(gòu)狀態(tài)評估有關(guān)的研究還包括荷載效應(yīng)分析、可靠度分析、安全預(yù)警、傳感器故障識別等。
在數(shù)據(jù)驅(qū)動的方法下,橋梁結(jié)構(gòu)損傷或異常識別與狀態(tài)評估大都可歸類于模式識別問題。傳統(tǒng)數(shù)據(jù)驅(qū)動的分析中,模式識別前一般要先對多通道、多種類的傳感器時間序列數(shù)據(jù)進(jìn)行降維,以提升機器學(xué)習(xí)方法的效率和準(zhǔn)確性。然而降維存在定階的問題,即需要確定最終的變量個數(shù),盡可能多地保留原始數(shù)據(jù)中的信息。此外,損傷識別、傳感器故障識別等問題常缺乏足夠的標(biāo)注數(shù)據(jù),使得有監(jiān)督學(xué)習(xí)方法很難被應(yīng)用;無監(jiān)督學(xué)習(xí)雖不使用標(biāo)注數(shù)據(jù)但對參數(shù)設(shè)定敏感,且很容易陷入局部最優(yōu)解。PCP將人的認(rèn)知能力融入到數(shù)據(jù)分析中,為無法使用有監(jiān)督學(xué)習(xí)及無監(jiān)督學(xué)習(xí)不穩(wěn)定情況下的模式識別提供了新的思路,并可直接對原始高維數(shù)據(jù)進(jìn)行可視化。本文中,PCP在SHM模式識別中的性能將通過2個數(shù)據(jù)集驗證,這兩個數(shù)據(jù)集均取自某斜拉橋的健康監(jiān)測系統(tǒng)。該斜拉橋共布設(shè)有169個各種類型的傳感器,可實現(xiàn)對環(huán)境荷載與結(jié)構(gòu)響應(yīng)的長期實時監(jiān)測。
圖7 某斜拉橋傳感器布置圖第一個數(shù)據(jù)集取自2007年,包括四個數(shù)據(jù)維度,分別表示設(shè)置在主梁伸縮縫處的兩個伸縮儀(DP001,DP002)和跨中鋼箱梁腹板、底板位置的兩個溫度計(ST002,ST009)所測的17520條數(shù)據(jù)。兩個伸縮儀在安裝時因?qū)α后w的熱膨脹考慮不足而沒有設(shè)置足夠的預(yù)張量,使得夏天高溫時段的伸縮儀監(jiān)測值溢出其量程而不再發(fā)生明顯變化。發(fā)生故障的兩個伸縮儀中,DP001在高溫時段過后恢復(fù)工作,DP002則自此一直處于故障狀態(tài)(圖8)。除了正常變化狀態(tài)和伸縮儀故障兩種模式,時程圖上以0值出現(xiàn)的離群點構(gòu)成了另一類數(shù)據(jù)模式,其由供電中斷等臨時性故障引起,可被視為數(shù)據(jù)中的噪聲。PCP被用以識別這三種模式,為避免數(shù)據(jù)量增大產(chǎn)生的線段重疊問題,在此分別使用了基于Alpha混合(圖9)和基于分布直方圖的PCP方法(圖10)。
通過基于Alpha混合的PCP可以明顯地識別數(shù)據(jù)集的三種模式。正常狀態(tài)的數(shù)據(jù)表現(xiàn)為兩個伸縮儀間、兩個溫度計間大部分平行的線段,表明變量間具有正相關(guān)關(guān)系;伸縮儀與溫度計之間的交匯區(qū)域(綠色圈內(nèi))則表明了二者之間的負(fù)相關(guān)關(guān)系。在兩個伸縮儀對應(yīng)的坐標(biāo)軸底部均有密集的線段區(qū)域呈現(xiàn)較深的顏色(黑色圓圈內(nèi)),對應(yīng)著伸縮儀在夏天高溫時段的故障。在深顏色區(qū)域中,DP002伸縮儀線段比DP001伸縮儀更為密集,顏色更深,對應(yīng)著DP002處于失效狀態(tài)的時間更長。在4個坐標(biāo)軸最下方區(qū)域還存在一些遠(yuǎn)離趨勢的線段,即異常點模式(藍(lán)色虛線圈),對應(yīng)著數(shù)據(jù)中的噪聲點?;贏lpha混合的方法已可明顯地識別出數(shù)據(jù)集中的3種模式,相比之下,基于分布直方圖的PCP則可更為突出地顯示所關(guān)注的伸縮儀故障數(shù)據(jù)。
上面講到的第一個數(shù)據(jù)集中,正常狀態(tài)、傳感器故障、噪聲等模式是事先已知的。而本節(jié)第二個數(shù)據(jù)集中可知的僅有正常狀態(tài)的模式,PCP被用以探索該數(shù)據(jù)集中是否還隱藏有未知的模式。第二個數(shù)據(jù)集有7個變量,分別代表結(jié)構(gòu)一階振動頻率(豎向彎曲、橫向彎曲、扭轉(zhuǎn))、溫度、風(fēng)速、交通、濕度、交通荷載,其中交通荷載由該斜拉橋跨中所測加速度的均方根值(RMS)表征。該數(shù)據(jù)集的時間跨度長達(dá)5年,按每小時一個數(shù)據(jù)點的頻率計算得到了由2007年至2012年共52608條數(shù)據(jù)。為研究環(huán)境與運營荷載對結(jié)構(gòu)動力特性的影響規(guī)律,各變量之間的相關(guān)系數(shù)也分別被計算,并顯示在圖11、圖12中PCP的下部。在該數(shù)據(jù)集的模式識別中同樣使用了基于Alpha混合(圖11)和基于分布直方圖(圖12)的方法。
基于Alpha混合方法的PCP中,風(fēng)速與扭轉(zhuǎn)頻率、豎彎頻率的平行坐標(biāo)軸之間各存在兩個狹長的深色區(qū)域(藍(lán)色圓圈),可表明兩個變量間具有一定的正相關(guān)關(guān)系。這兩個變量與風(fēng)速的相關(guān)系數(shù)分別為0.199和0.132,則可推斷該相關(guān)系數(shù)很大程度上由PCP中的狹長深色區(qū)域解釋。同理,由在豎彎頻率與溫度、橫彎頻率與交通荷載坐標(biāo)軸間識別到的深顏色交匯區(qū)域(綠色圓圈),也能很大程度上解釋這兩組變量間的負(fù)相關(guān)系數(shù)。除了表示正相關(guān)關(guān)系的狹長形深色區(qū)域和表示負(fù)相關(guān)關(guān)系的交匯區(qū)域,還可在圖中識別到一些表現(xiàn)為細(xì)條形的模式,如交通荷載和橫彎頻率坐標(biāo)軸間黑色圓圈中所示。上述由PCP可視化特征識別的相關(guān)關(guān)系僅對應(yīng)著數(shù)據(jù)集中的一部分?jǐn)?shù)據(jù),在此將其定義為“局部相關(guān)關(guān)系”。局部相關(guān)關(guān)系模式所具備的物理意義當(dāng)前尚無法解讀,有待于通過交互式的PCP方法提取出來作進(jìn)一步的分析。
由于數(shù)據(jù)量較大,基于Alpha混合的方法必須設(shè)定很小的透明度值(在此為Alpha=0.001)。但Alpha值在繪制PCP的OpenGL(繪制計算機圖形的函數(shù)庫)中不可能無限小,在更大規(guī)模的數(shù)據(jù)集中,該方法仍將受到線段重疊的影響而無法使用?;诜植贾狈綀D的PCP方法中,線段數(shù)量取決于分布直方圖的數(shù)量,可不受透明度下限值的影響。采用分布直方圖方法的圖12中交換了部分坐標(biāo)軸的順序,仍可以識別線段交匯的深色區(qū)域、細(xì)條形深色區(qū)域所表示的局部相關(guān)關(guān)系,但對狹長形的深色區(qū)域呈現(xiàn)不夠明顯,這與該模式的特征不明顯有關(guān),也說明在繪制PCP的過程中應(yīng)結(jié)合使用多種參數(shù)(直方圖數(shù)、透明度等),以更全面地識別可能被遺漏的模式。
在橋梁結(jié)構(gòu)健康監(jiān)測領(lǐng)域,深厚的力學(xué)背景雖決定了對橋梁結(jié)構(gòu)機理和行為較高程度的認(rèn)知,但實測數(shù)據(jù)中仍存在環(huán)境與運營荷載、采集設(shè)備故障等所產(chǎn)生的不確定性因素。認(rèn)知這些不確定性因素、從中識別隱藏的模式,并合理解釋其對應(yīng)的物理現(xiàn)象,是采用包括可視化分析在內(nèi)的大數(shù)據(jù)分析方法應(yīng)試圖去解決的問題。
本文介紹了在大數(shù)據(jù)可視化分析中常用的PCP方法,通過某斜拉橋結(jié)構(gòu)健康監(jiān)測系統(tǒng)所采集的兩個數(shù)據(jù)集,對其數(shù)據(jù)可視化和模式識別功能的適用性進(jìn)行了驗證,可得到以下結(jié)論:
(1) PCP方法可用以識別傳感器故障引起的數(shù)據(jù)異常,基于分布直方圖的PCP方法能夠更為突出地顯示該種模式。
(2) PCP方法中的趨勢模式可呈現(xiàn)環(huán)境荷載與結(jié)構(gòu)響應(yīng)之間的局部相關(guān)關(guān)系,且能夠反映大數(shù)據(jù)分析“追求相關(guān)關(guān)系而非因果關(guān)系”的思維方式。
(3) 與局部相關(guān)關(guān)系模式對應(yīng)的數(shù)據(jù)有必要被提取出來以進(jìn)一步的分析,能夠選擇并提取相應(yīng)線段的交互式PCP方法仍有待于在后續(xù)研究中被開發(fā)。
大數(shù)據(jù)方法在結(jié)構(gòu)健康監(jiān)測數(shù)據(jù)分析中的應(yīng)用研究才剛剛開始,橋梁結(jié)構(gòu)是遵循力學(xué)原理設(shè)計出的一個人工產(chǎn)品,相應(yīng)的監(jiān)測數(shù)據(jù)具有明顯的“工業(yè)大數(shù)據(jù)”特征,在借鑒其他領(lǐng)域的大數(shù)據(jù)分析方法時,我們也應(yīng)十分注意方法的適用性,避免步入誤區(qū)。