氣相色譜定量分析歸一化定義:歸一化就是要把需要處理的數(shù)據(jù)經(jīng)過(guò)處理后(通過(guò)某種算法)限制在你需要的一定范圍內(nèi)。首先歸一化是為了后面數(shù)據(jù)處理的方便,其次是保證程序運(yùn)行時(shí)收斂加快。歸一化的具體作用是歸納統(tǒng)一樣本的統(tǒng)計(jì)分布性。歸一化在0-1之間是統(tǒng)計(jì)的概率分布,歸一化在某個(gè)區(qū)間上是統(tǒng)計(jì)的坐標(biāo)分布。歸一化有同一、統(tǒng)一和合一的意思。
歸一化法適用范圍:適合樣品中各組分都能流出色譜柱,并能在色譜圖中出峰,比較適合工廠定量樣品組成,如果需要減少誤差,可以用修正面積歸一法。
氣相色譜定量分析定量計(jì)算方法歸一化法其計(jì)算公式:Pi % = (mi / m) · 100%= Aif¢i / (A1f¢1 + A2f¢2 + ¼+Anf¢n) · 100%
式中Pi %為被測(cè)組分i的百分含量; A1、A2 An為組分1 ~ n的峰面積;f¢1、f¢2? f¢n為組分1 ~ n的相對(duì)校正因子。當(dāng)f¢i 為質(zhì)量相對(duì)校 的正因子時(shí),得到質(zhì)量百分?jǐn)?shù);當(dāng)f¢i 為摩爾相對(duì)校正因子時(shí),得到摩爾百分?jǐn)?shù)。
歸一化法的優(yōu)點(diǎn)是簡(jiǎn)單、準(zhǔn)確,操作條件變化時(shí)對(duì)定量結(jié)果影響不大。但此法在實(shí)際工作中仍有一些限制,比如,樣品的所有組分必須全部流出,且出峰。某些不需要定量的組分也必須測(cè)出其峰面積及f¢i 值。此外,測(cè)量低含量尤其是微量雜質(zhì)時(shí),誤差較大。
歸一化方法有兩種形式,一種是把數(shù)變?yōu)椋?,1)之間的小數(shù),一種是把有量綱表達(dá)式變?yōu)闊o(wú)量綱表達(dá)式。主要是為了數(shù)據(jù)處理方便提出來(lái)的,把數(shù)據(jù)映射到0~1范圍之內(nèi)處理,更加便捷快速,應(yīng)該歸到數(shù)字信號(hào)處理范疇之內(nèi)。
歸一化法中的校正因子是通過(guò)配制與樣品相同組分的標(biāo)準(zhǔn)品求出的。
如果不做相對(duì)校正因子,采用面積歸一化法的誤差大小取決與被測(cè)各組分在檢測(cè)器上的單位質(zhì)量的應(yīng)答值大小,比如FID檢測(cè)器測(cè)苯和甲烷不用相對(duì)校正因子,測(cè)定結(jié)果會(huì)相差喲5倍,2-甲基戊烷和3-甲基戊烷測(cè)定結(jié)果會(huì)相同。個(gè)別的小峰不能定性的用臨近的峰校正因子代替。
氣相色譜定量分析常用的歸一化方法:(1)min-max標(biāo)準(zhǔn)化(2)Z-score標(biāo)準(zhǔn)化方法
氣相色譜定量分析兩種歸一化方法的使用場(chǎng)景:
1 在分類(lèi)、聚類(lèi)算法中,需要使用距離來(lái)度量相似性的時(shí)候、或者使用PCA技術(shù)進(jìn)行降維的時(shí)候,第二種方法(Z-score standardization)表現(xiàn)更好。
因?yàn)椋旱谝环N方法(線性變換后),其協(xié)方差產(chǎn)生了倍數(shù)值的縮放,因此這種方式無(wú)法消除量綱對(duì)方差、協(xié)方差的影響,對(duì)PCA分析影響巨大;同時(shí),由于量綱的存在,使用不同的量綱、距離的計(jì)算結(jié)果會(huì)不同。
2 在不涉及距離度量、協(xié)方差計(jì)算、數(shù)據(jù)不符合正太分布的時(shí)候,可以使用第一種方法或其他歸一化方法。比如圖像處理中,將RGB圖像轉(zhuǎn)換為灰度圖像后將其值限定在0 255的范圍。
因?yàn)椋旱诙N歸一化方式中,新的數(shù)據(jù)由于對(duì)方差進(jìn)行了歸一化,這時(shí)候每個(gè)維度的量綱其實(shí)已經(jīng)等價(jià)了,每個(gè)維度都服從均值為0、方差1的正態(tài)分布,在計(jì)算距離的時(shí)候,每個(gè)維度都是去量綱化的,避免了不同量綱的選取對(duì)距離計(jì)算產(chǎn)生的巨大影響。
在Z-score標(biāo)準(zhǔn)化(0均值標(biāo)準(zhǔn)化)中,新的數(shù)據(jù)由于對(duì)方差進(jìn)行了歸一化,這時(shí)候每個(gè)維度的量綱其實(shí)已經(jīng)等價(jià)了,每個(gè)維度都服從均值為0,、方差為1的正態(tài)分布,在計(jì)算距離的時(shí)候,每個(gè)維度 都是去量綱化的,避免了不同量綱的選取對(duì)距離計(jì)算產(chǎn)生的巨大影響。
總的來(lái)說(shuō),在算法、后續(xù)計(jì)算中,涉及距離度量(聚類(lèi)分析)或者協(xié)方差分析(PCA、LDA等)的,同時(shí)數(shù)據(jù)分布可以近似為狀態(tài)分布,應(yīng)當(dāng)使用0均值化的歸一方法。其它應(yīng)用中,根據(jù)具體情況選用合適的歸一化方法。