290 likes | 494 Views
中文 DNS 發展現況. TWNIC 陳玉萱工程師 erin@twnic.net.tw 2002/1/17. 中文 DNS 發展現況. DNS 運作基本架構 中文網域名稱碰到問題 TWNIC 整體解決方案 Server 端之解決方案 Client 端之解決方案 ( 好幫手 ) Internet IDN 標準制定現況 IETF IDN WG 現況 中文域名繁簡轉換之基本需求 CDNC 對 IETF IDN 標準之因應方案. DNS 運作基本架構. Root server. tw,cn,jp … (cctld).
E N D
中文DNS發展現況 TWNIC 陳玉萱工程師 erin@twnic.net.tw 2002/1/17
中文DNS發展現況 • DNS運作基本架構 • 中文網域名稱碰到問題 • TWNIC整體解決方案 • Server 端之解決方案 • Client 端之解決方案(好幫手) • Internet IDN 標準制定現況 • IETF IDN WG 現況 • 中文域名繁簡轉換之基本需求 • CDNC 對 IETF IDN 標準之因應方案
DNS運作基本架構 Root server tw,cn,jp…(cctld) com,net,org…(gtld) com,net,org,商業,網路… twnic 台網中心 www 台網中心.網路.tw192.83.166.15 www.twnic.net.tw192.83.166.15
中文網域名稱碰到問題(1) • Server端的問題 • DNS Server • BIND version 8以前無法使用中文網域名稱 • WEB Server • 僅支援英文網域名稱功能 • 支援中文網域名稱功能,並同時設定有中文及英文網域名稱 • 支援中文網域名稱功能,但僅設定有中文網域名稱
中文網域名稱碰到問題(2) • Client 端碰到的問題 • IE瀏覽器的UTF-8 Enable • 解析器(Resolver)會將反斜線’\’(05c)去除 • 如:功(0xa55c)、許(0xb35c)、餐(0xc05c)、蓋(0xbb5c)…等 • 中文字衝碼‘@’(0x40)造成browser錯誤解析URL • 如:一(0xa440)、世(0xa540)、昇(0xaa40)、共(0xa640)、護(0xc540)、作(0xa740)、耐(0xad40)、等 • 經過Proxy 或 Firewall 無法正確解析中文網域名稱
[root@pc071 bind_src]# nslookup Default Server: twnic.net.tw Address: 211.72.210.250 >商業.tw Name: \176\211\183~.tw Address: 203.73.24.11 [root@pc071 bind_src]# nslookup Default Server: twnic.net.tw Address: 211.72.210.250 >商業.tw Name: 商業.tw Address: 203.73.24.11 Server 端之解決方案 • ISC BIND改版 改版前 改版後
相關Server端改版軟體 • http://cdns.twnic.net.tw/download/download.shtml • DNS BIND: 8.2.5 • WEB APACHE: 1.3.19 • PROXY SQUID: 2.3-stable3
Server技術介紹(1) • Web server軟體 • 若沒有提供name base虛擬主機的情況下大部的web server軟體都能處理中文網域名稱 • 若要設定成中文網域名稱的虛擬主機方式,可使用TWNIC改版的web server軟體
Server技術介紹(2) • 中文網域名稱轉址 • 對於不打算改成中文web server的客戶,代理註冊機構提供中文網域名稱轉址服務 • 轉址服務的方式: • http redirect指令: URL會變成英文網域名稱 • html frame指令: URL會保留中文網域名稱,即使已離開該網站
Server技術介紹(3) • 中文DNS • 新版的DNS軟體已可設定中文網域名稱 • TWNIC亦提供中文版的DNS軟體 • 對於不想安裝支援中文DNS軟體的客戶,TWNIC提供主機模式以協助客戶完成DNS指定作業
Server技術介紹(4) • 中文DNS • BIG5編碼: windows 95、98、me、NT • UTF-8編碼: windows 2000、xp • GB編碼: 簡體字版windows • *.TW: 在DNS中TWNIC以萬用字元的方式提供輔助查詢功能,當所輸入的中文網域名稱不存在時,會找出近似的中文網域名稱供點選
Server技術介紹(5) • 為了讓在環境上無法使用中文網域名稱(如部份transparent proxy、firewall等無法通過中文網域名稱)的使用者在不下載Client軟體的情況下也能使用中文網域名稱,TWNIC提供一轉址proxy server,只要將自動組態script設成http://www.twnic.net.tw/proxy.pac即可由轉址proxy server將中文網域名稱轉成英文網域名稱以達成訪問目的
Client軟體(好幫手)作了那些事 • 將“永遠以UTF-8傳送URL”的選項取消 • 在URL輸入列攔截使用者輸入的中文網域名稱送到特定server解析成英文網域名稱以避免browser判斷錯誤及通過不支援中文網域名稱的proxy server • 設定自動組態script將網頁中的中文網域名稱超連結送到server解析成英文網域名稱再交由browser處理
Client軟體解析規則 • 對於TWNIC、CNNIC所提供之中文網域名稱予攔截解析成英文網域名稱 • .TW,.CN,.台灣,.臺灣,.中國(Big5,GB繁簡體 ) • 對於英文字串(沒有點)則分別查詢COM.TW,ORG.TW,NET.TW,GOV.TW.EDU.TW,IDV.TW的DNS看是否有對應的domain name,若有則redirect或列出供使用者點選 • 對於中文字串(沒有點)則加上.TW在後面查詢DNS,若查不到前面再加上WWW.再查詢DNS
使用Client軟體的優、缺點 • 優點 • 不論所在之環境是否可支援中文網域名稱,皆可正常解析中文網域名稱 • 提供額外的keyword輸入方式,快速連結網站 • 缺點 • 可能會與其他軟體相衝突 • 不易大量普及 • browser更換版本後需重新安裝
中文網域名稱相關網站 • 中文網域名稱技術服務網站 • http://cdns.twnic.net.tw • TWNIC首頁 • http://www.twnic.net.tw • CNNIC首頁 • http://www.cnnic.net.cn • CDNC首頁 • http://www.cdnc.org
Internet IDN 標準制定現況 • IETF IDN WG 現況 • 中文域名繁簡轉換之基本需求 • CDNC 對 IETF IDN 標準之因應方案
IETF IDN WG 現況 • IDN WG draft • IDNA, NAMEPREP/STRINGPREP, PUNYCODE 已提交至 IESG • 目前在 IDN WG 面臨的困難 • Unicode對繁簡字關係之定義不明確 • 中文域名專用一對一繁簡對照表尚待確認 • IDNA-NAMEPREP-PUNYCODE之架構未包含中文域名繁轉換之需求 • 目前已提出與中文域名相關之draft • Traditional and Simplified Chinese Conversion(TSCONV-03) • Requirements of Chinese Domain Name(CDNREQ-00) • Phased Implementation for Internationalized Domain Names in Applications(PIIDNA-00)
User input (UNICODE) IDNA NAMEPREP ACE To resolver (PUNYCODE) IDNA-NAMEPREP-PUNYCODE架構圖 • Application Client
中文域名繁簡轉換之基本需求 • 因Unicode沒有定義中文域名專用繁簡中文對照之關係 • 使用者只需註冊一筆中文域名 • 不需註冊2^n筆中文域名來保護所有的智慧財產權 • 例如: 臺灣大學(U+81FA, U+7063, U+5927, U+5B78) • 臺灣大學(U+81FA, U+7063, U+5927, U+5B78) • 臺灣大学(U+81FA, U+7063, U+5927, U+5B66) • 臺湾大學(U+81FA, U+6E7E, U+5927, U+5B78) • 臺湾大学(U+81FA, U+6E7E, U+5927, U+5B66) • 台灣大學(U+53F0, U+7063, U+5927, U+5B78) • 台灣大学(U+53F0, U+7063, U+5927, U+5B66) • 台湾大學(U+53F0, U+6E7E, U+5927, U+5B78) • 台湾大学(U+53F0, U+6E7E, U+5927, U+5B66)
User input (UNICODE) IDNA NAMEPREP ACE To resolver (PUNYCODE) 中文域名繁簡轉換之基本需求 • 若使用者使用與原註冊中文域名有繁簡對應關係之繁簡字仍可正確訪問到中文域名 • 即使經過IDNA-NAMEPREP-PUNYCODE之轉換仍可正確顯示原有之繁簡字
CDNC 對 IETF IDN 標準之因應方案 • 第七次CDNC台北會議之結論 • 中文域名之後續發展 • 目的 • 仍遵循 Internet 標準 • 避免IDNA-NAMEPREP-PUNYCODE架構成為IDN標準, 但因其未容納CDN之需求而產生之問題 • 結論 • 及時提出 CDN Solution of CDNC • 架構在 IDNA-NAMEPREP-PUNYCODE 之上
User input: TSTTTS CHSE (UNICODE,flag) IDNA NAMEPREP ACE To resolver:bq--AbCXYz CDN Solution of CDNC Architecture • User probably input in mixed TC/SC • Ex: TSTTTS • CHSE(Chinese Half Self Encoding) to give a TC/SC flag in the form of (UNICODE,flag) • The output of IDNA after ACE will in the form of • Bq--AbCXYz • When DNS string compare can match any 1 of 2^n
CDNC發展中文域名預定之後續工作 • 於一月底前完成CDN Solution of CDNC, 以簡化字總表為基礎, CNNIC及TWNIC雙方先定義一對一繁簡對照表, 開發並完成各項技術工作 • 二月八日前CDNC對外公佈測試用之“中文域名專用一對一繁簡對照表” • 六月底前CNNIC及TWNIC雙方邀集文字專家協助校驗中文域名專用之繁簡對照表 • 六月底前公佈配套之註冊規則 • 七月初正式實施 CDN Solution of CDNC
中文DNS發展現況 問題與討論