1 / 45

專利分群

專利分群. Non-exhaustive clustering. 工工系 9534059 謝皓娟. 動機與目標. 動機 : 由於,專利文件有許多欄位,不一定以整份文件去做分群的結果是最好的。. 動機與目標. 將相同的專利文件,以 (1) title + abstract (2) claim (3) description 去做分群,看哪種類型的結果最為適當. 分群前處理 --- 關鍵字關聯性運算. TEXT MINING: 斷詞 字根還原 停字 ……

Download Presentation

專利分群

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 專利分群 Non-exhaustive clustering 工工系 9534059 謝皓娟

  2. 動機與目標 • 動機: 由於,專利文件有許多欄位,不一定以整份文件去做分群的結果是最好的。

  3. 動機與目標 • 將相同的專利文件,以 (1) title + abstract (2) claim (3)description 去做分群,看哪種類型的結果最為適當

  4. 分群前處理---關鍵字關聯性運算 • TEXT MINING: 斷詞 字根還原 停字…… • 計算TF-IDF • 計算NTF-IDF

  5. TF_IDF • Term frequency (TF factor): Measure number of times a word appears in a document • IDF factor: Measure number of times the word appears in all document in a set

  6. =文件集的總字數

  7. 分群前處理---關鍵字關聯性運算 • 關鍵字之間的關連性

  8. 方法論_ Non-exhaustive clustering • Non-exhaustive clustering的方法,是運用Overlapping Partitioning Cluster (OPC) algorithm依照門檻值來決定資料彼此是否屬於同一群集。 • 所以,資料點不一定只屬於一個群集,可能同時有兩個或兩個以上的群集包含它

  9. Non-exhaustive專利分群 • 將關鍵字之間的距離,轉換成介於0到1之間的相似程度(Similarity level) • 相似程度(Similarity level) • 計算出YN矩陣

  10. CRF • 為了從t個關鍵字中找出k個關鍵字作為群集中心,CRF值便是用來評估選擇最合適的關鍵字,作為起始群集中心 • Crowding value

  11. CRF

  12. 資料收集_專利檢索 • USPTO 專利資料庫 • 關鍵字: • Adtec AND position:26 • align AND ORC :10 • exposure AND Adtec:14 • exposure position AND ORC:12 • ORC AND projection optical:2 • ORC AND transport:1

  13. LKM_上傳資料

  14. TF矩陣

  15. NTF矩陣

  16. NTF-IDF矩陣

  17. 前50候選詞彙

  18. 關鍵字關聯性矩陣

  19. YN矩陣 •  select YN_MIN from NON_EXHAUSTIVE_VARIABLE where TYPE = 'KE2' •  select * from (select MIN from NON_EXHAUSTIVE_YNMATRIX where TYPE = ‘KE2’ ORDER BY TO_NUMBER(MIN)) where rownum <= 2000 • 門檻值比例:TOP80.0% • 門檻值總數:共2500個 • 門檻值上限:第2000個 • 門檻值數值:必須大於0.35

  20. YN矩陣

  21. 關鍵字CRF值

  22. OBJcurrent

  23. 結果_claim_3 • 第一群 • 中心詞彙:KP3 exposing stage • 同群詞彙:lower printing frame / mask film / exposing apparatus / alignment table / connecting / step / lower frame plate / process / suction / upper printing frame / alignment stage / movable table / mask alignment system / lifted / lightning device / reverse stage / camera / vacuum frame / 

  24. 結果_claim_3 • 第二群 • 中心詞彙:KP37 raising • 同群詞彙:pile forming ledge / wherein / severed / pile loops lc / pile loops lu / pattern jacks / arranged / retracting / course / circular knitting machine / stitch / 

  25. 結果_claim_3 • 第三群 • 中心詞彙: • 同群詞彙:lower printing frame / exposing stage / exposing apparatus / alignment table / connecting / process / wherein / suction / upper printing frame / reverse stage / 

  26. 結果_claim_3

  27. 結果_description_3 • 第一群 • 中心詞彙:KP1 lower printing frame • 同群詞彙:transferred / exposing stage / alignment table / alignment stage / shown / upper printing frame / handler / transparent plate / exposing apparatus / reverse stage / feed / delivery table / 

  28. 結果_description_3 • 第二群: • 中心詞彙:KP47 mounting table • 同群詞彙:exposing stage / camera / moving / mask film / alignment table / lower frame plate / alignment stage / shown / alignment operation / mark wm / shear / movable table / mask mark mm / situation / exposing apparatus / plane view / inscribed circle / memorized / circumscribed rectangle / 

  29. 結果_description_3 • 第三群: • 中心詞彙:KP5 camera • 同群詞彙:moving / shown / alignment operation / mark wm / shear / mask mark mm / situation / plane view / inscribed circle / memorized / mounting table / circumscribed rectangle / 

  30. 結果_description_3

  31. 結果_claim_4 • 第一群: • 中心詞彙: reverse stage • 同群詞彙: lower printing frame / exposing stage / exposing apparatus / alignment table / connecting / process / wherein / suction / upper printing frame / camera / vacuum frame / 

  32. 結果_claim_4 • 第二群: • 中心詞彙: suction • 同群詞彙: lower printing frame / exposing stage / mask film / exposing apparatus / alignment table / connecting / step / lower frame plate / process / wherein / upper printing frame / alignment stage / movable table / mask alignment system / lifted / lightning device / reverse stage / camera / vacuum frame / 

  33. 結果_claim_4 • 第三群: • 中心詞彙: wherein • 同群詞彙: lower printing frame / table / alignment table / pile forming ledge / connecting / process / suction / severed / upper printing frame / transferring passage / pile loops lc / pile loops lu / pattern jacks / arranged / retracting / apparatus / raising / conveying / mask / course / circular knitting machine / stitch / reverse stage / camera / vacuum frame / 

  34. 結果_claim_4 • 第四群: • 中心詞彙: substantially vertical position • 同群詞彙: substrate / hold / moving / plurality / 

  35. 結果_claim_4

  36. 結果_description_4 • 第一群 • 中心詞彙:KP31 plane view • 同群詞彙: camera / moving / shown / alignment operation / mark wm / shear / mask mark mm / situation / inscribed circle / memorized / mounting table / circumscribed rectangle / 

  37. 結果_description_4 • 第二群 • 中心詞彙: arc extinguishing capacitor • 同群詞彙: capacitive coupling electrode / floating electrode / ozone generator / insulating material / 

  38. 結果_description_4 • 第三群 • 中心詞彙: mounting table • 同群詞彙: exposing stage / camera / moving / mask film / alignment table / lower frame plate / alignment stage / shown / alignment operation / mark wm / shear / movable table / mask mark mm / situation / exposing apparatus / plane view / inscribed circle / memorized / circumscribed rectangle / 

  39. 結果_description_4 • 第四群 • 中心詞彙: inscribed circle • 同群詞彙: camera / moving / shown / alignment operation / mark wm / shear / mask mark mm / situation / plane view / memorized / mounting table / circumscribed rectangle / 

  40. 結果_description_4

More Related