280 likes | 384 Views
人工智慧演算法於時間序列模型之整合. 黃日鉦 東吳大學資訊管理學系. 基因演算法 Genetic Algorithm (GA). 1975 年由密西根大學教授 John Holland 所提出 藉由生物物種的基本運算子,在每代間進行演化,終而尋得適當問題的最佳解。 物競天擇,適者生存. 基因演算法的優點. 遺傳演算法的運算,主要在參數經過編碼的位元字串上,而非參數本身,所以在搜尋分析上不受參數連續性的限制。
E N D
人工智慧演算法於時間序列模型之整合 黃日鉦 東吳大學資訊管理學系
基因演算法Genetic Algorithm (GA) • 1975年由密西根大學教授John Holland所提出 • 藉由生物物種的基本運算子,在每代間進行演化,終而尋得適當問題的最佳解。 • 物競天擇,適者生存
基因演算法的優點 • 遺傳演算法的運算,主要在參數經過編碼的位元字串上,而非參數本身,所以在搜尋分析上不受參數連續性的限制。 • 遺傳演算法採用隨機多點同時搜尋的方式(複製 (reproduction)、交配(crossover)、突變(mutation)) ,而非傳統的單點依序搜尋方式,因此可以避免侷限在區域的最佳解上,而得到問題的最佳解上。 • 遺傳演算法則運算時只需訂定問題要求的目標函數(Objective function) ,並不需其他的的輔助資訊(如函數的微分性、連續性) ,所以適合各類問題的目標函數。
編碼 (Encoding) • 依編碼資料型態的不同,可以分為:整數編碼、實數編碼、二進位編碼、文字編碼以及符號編碼等
初始族群 (Initial population) • 先必須隨機的產生q個染色體(chromosomes),這q個染色體稱為初始族群 • 族群中的每個染色體亦稱之為一個個體(Individual)
染色體 (chromosome) • 運算子運算的對象是染色體 • 染色體的型態是由一串數字串接而成的字串 • 每一個染色體都對應到目標問題的一個解 • 將每個參數之編碼字串串接起來就組成染色體 • 染色體的長度及個體都會影響到目標問題的精確度及難度 • 染色體長度越長則目標問題的分割就越精密
適合度函數 (fitness) • 評估適者生存,不適者淘汰的指標。 • 適合度函數值越高表示個體的適合度越好、競爭力越強,相對的也就越可能將基因遺傳到下一代身上。 • 可以藉由設計不同的適合度函數來達到控制演化,進而產生不同的結果。
複製(reproduction) • 輪盤式選擇(roulette wheel selection) • 在每一代的演化過程中,依每個物種的適應函數值的大小來表被挑選到交配池中的機率,然後隨機選入到交配池中。 • 競爭式選擇(tournament selection) • 在每一代的演化過程中,隨機選取兩個或更多的物種,具最大適應函數值的物種即被選中送至交配池中。
交配(crossover) • 交配池中的兩個母代個體,彼此交換位元資訊進而產生兩個新的個體 • 藉由累積前代較為優良的位元資訊,以期待能夠產生出更優秀的個體 • 事先設定的交配機率(probability of crossover)來決定是否要進行交配的運算 • 依據交配方式的不同,又可分為單點、兩點以及均勻三種
突變(mutation) • 純粹靠著複製與交配這兩個運算的話,無法創造出具有新特性的個體。 • 希望透過突變的方式使得新的個體可以跳脫單純交配的區域解中,進而產生全域最佳解。 • 突變方式為隨機改變染色體之位元。
演化終止條件 • 當演化流程達到指定的世代數目時; • 當演化流程達到要求的目標時; • 當演化流程停滯或者是已經達到某種飽和現象時。
基因演算法於時間序列的應用 • ARMA (p,q) Family • GARCH (p,q) Family • ARCH • GARCH • IGARCH • EGARCH • FIGARCH • FIAPARCH
Model Identification Model Estimation Is satisfied model checking? No Yes Model Forecasting 模式設定
GARCH Family模型參數考量 • Traditional model identification • GARCH (1,1), GARCH (1,2), GARCH (2,1), GARCH (2,2),… • Local optimization vs. Global optimization? • GARCH (2,2) • GARCH((2),(2))
全域解的問題 • Computational cost • Required time • For a GARCH(p,q) model • Effectiveness of GAs
基因演算法參數設定 • String representation • If the chromosome is represented by (010;001), the GARCH model should be ARCH((2),(3)) • Population initialization • Selected at random • Fitness computation • AIC • BIC • HQC • …
Gene Operators • Crossover = two-point • Mutation= random • Pc = 0.9 • Pm = 0.01 • Iteration = 100
Empirical studies- Case I • Return rates of AT&T • From Jan 1961 to Dec 1967
Model Identification • GARCH • IGARCH
Model Identification (conti.) • EGARCH
Empirical studies- Case II • Shanghai A Shares • From 2002/01/04 to 2008/12/31
Model Identification • FIGARCH • FIAPARCH
Traditional model identifications of FIGARCH and FIAPARCH Note: NA denotes no convergence with respect to any d.
結論 • 基因演算法提供一個更穩健、彈性及方便的模式設定方式。 • 適合使用在複雜的時間序列模型。 • Objective function的重要性。 • 其他相關議題的使用 • 變數選擇 • 參數估計 • …