1 / 37

Active Basis 活動基 for Modeling, Learning and Recognizing 表達、學習、識別 Deformable Template 可變形模板

Active Basis 活動基 for Modeling, Learning and Recognizing 表達、學習、識別 Deformable Template 可變形模板 Ying Nian Wu 吳英年 UCLA Department of Statistics Joint work with Zhangzhang Si, Haifeng Gong, and Song Chun Zhu 司長長、龔海峰、朱松純 ( this version is outdated, see

arawn
Download Presentation

Active Basis 活動基 for Modeling, Learning and Recognizing 表達、學習、識別 Deformable Template 可變形模板

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Active Basis 活動基 for Modeling, Learning and Recognizing 表達、學習、識別 Deformable Template 可變形模板 Ying Nian Wu 吳英年 UCLA Department of Statistics Joint work with Zhangzhang Si, Haifeng Gong, and Song Chun Zhu 司長長、龔海峰、朱松純 (this version is outdated, see http://www.stat.ucla.edu/~ywu/AB/ActiveBasisMarkII.html for the most updated version)

  2. Reproducibility page 可重復網頁 http://www.stat.ucla.edu/~ywu/ActiveBasis Matlab/C code, Data 源代碼、數據 Wu, Si, Gong, Zhu, 2008

  3. Deformable template可變形模板 • Yuille, Hallinan, Cohen, 1989 • key element in object recognition 物體識別 • Represent and learn the deformable template • 表達和學習 • Wu, Si, Gong, Zhu, 2008

  4. Deformable template可變形模板 • Recognize the deformable template • 學以致用:舉一反三、觸類旁通 • Wu, Si, Gong, Zhu, 2008

  5. Content • Representation: Active basis model • 活動基模型 • Algorithm: Shared sketch algorithm • 共同勾畫算法 • Computational architecture: Sum-max maps • 體系結構:局部求和圖、局部求極值圖 • Wu, Si, Gong, Zhu, 2008

  6. Gabor wavelets 賈巴小波 Daugman, 1985 Olshausen, Field, 1996 simple cells 可以平移、旋轉、放縮 不同位置、不同角度、不同頻率的局部波動

  7. Gabor wavelets 賈巴小波 不同位置、不同角度、不同頻率的局部波動 操作 Olshausen, Field, 1996: wavelet sparse coding 表達 小波稀疏編碼:由大量的像素到少量的線段 操作在表達的指導下變得有的放矢

  8. Active basis 活動基 Wu, Si, Gong, Zhu, 2008 每一個細橢圓代表一個小波,活動基的一個基元 每個小波可以沿法向平移、也可以旋轉 局部范圍內的擾動:刻畫附近的邊

  9. Active basis 活動基 每一個小線段代表一個小波,活動基元 小波可以沿法向平移、也可以旋轉 局部范圍內的移動:刻畫附近的邊

  10. Active basis活動基 每一個小線段代表一個小波,活動基元 小波可以沿法向平移、也可以旋轉 局部范圍內的活動:刻畫附近的邊

  11. 活動基和基元的活動

  12. Matching pursuit 匹配追尋 Mallat, Zhang, 1993 表達指導下的操作 解釋走之后的再解釋 線性回歸中的前向的變量選擇

  13. Shared sketch 共同勾畫 Wu, Si, Gong, Zhu, 2008 同時進行的匹配追尋 當一個活動基元被選中后,我們可以局部移動它 同時刻畫所有圖像中的邊 每一個活動基元就如同一個漢字中的一筆一畫 我們的算法就是在眾多同類物體的圖像中,造出一個字

  14. Shared sketch 共同勾畫算法 選取的每一筆畫在略加移動后盡量能畫在所有物體的邊上 也就是對應這一筆的局部波動的振幅在所有的圖像中都很大 每一筆都盡量畫出本組圖像和其它無關圖像的最大差異

  15. Pursuit index and template matching score 追尋目標 h-函數:抑制強邊 一圖一票選舉筆畫 指數族分布、指數傾斜 似然函數:學習模板 給模板匹配打分

  16. 似然函數:學習模板 給模板匹配打分

  17. 似然函數:學習模板 給模板匹配打分

  18. Recognizing learned deformable template 認識學習到的可變形模板:舉一反三 Wu, Si, Gong, Zhu, 2008 局部求和:模板匹配打分 此處有字否? 局部求極值:附近有筆畫否? 局部求和:局部波動的振幅 此地有筆畫否? Riesenhuber and Poggio, 1999 complex cell: local maximum pooling

  19. 多個分辨率(尺度)

  20. Classification 識別:正例、反例 在訓練圖像上學習 在檢驗圖像上考試 Viola and Jones, 2004: adaboost for face

  21. EM and K-mean Clustering 分門別類 多類別混合 自學、發現隱含的結構 似然函數中加入隱含變量

  22. EM and K-mean Clustering 分門別類

  23. EM and K-mean Clustering 分門別類 物以類聚,人以群分

  24. Learning from non-aligned training images

  25. Learning from non-aligned training images 自動發現物體在何處,對齊 似然函數給對齊度打分 只告知第一幅圖中物在何處

  26. Learning moving template from video sequence 行動中的模板 自動發現速度、對齊 似然函數給對齊度打分

  27. Composing multiple templates 偏旁部首

  28. 字由偏旁部首組成 偏旁部首由筆畫組成

  29. 何處分割有最佳對齊度? 仍然用似然函數給對其度打分

  30. Content • Representation: Active basis model • 活動基模型 • Algorithm: Shared sketch algorithm • 共同勾畫算法 • Computational architecture: Sum-max maps • 體系結構:局部求和圖、局部求極值圖 • Wu, Si, Gong, Zhu, 2008

  31. Key references • Olshausen, Field, 1996: wavelet sparse coding • Riesenhuber and Poggio, 1999: local maximum pooling • cortex-like structure • Viola and Jones, 2004: adaboost for face • Acknowlegement • Chuck Fleming, Alan Yuille, Zhuowen Tu, Leo Zhu • NSF-DMS 0707055, NSF-IIS 0713652 • Lotus Hill Institute

More Related