520 likes | 596 Views
語言與資訊:釐清台灣地名厝屋. 鄭錦全 2003 年 2 月 20 日. 本課題的研究得到許多同事的幫助。 中央研究院計算中心白璧玲女士和賴昆祺先生提供地理資訊系統的地名檔案, 語言學研究所蕭素英、江敏華、吳品慧、林千慧等同仁到新竹縣新豐鄉完成兩百戶的家庭語言調查、測量地理座標,讓我共同建構新豐鄉閩客方言分布地理資訊系統, 在此一并致謝。. 語言與資訊. 何大安先生在語言學研究所成所的海報上寫著 “ 因為有了語言,知識成為無限 ” 。 反過來說,如果沒有語言,知識很難建立。例如,沒有語言,我們就說不出自己的名字,也很難表達自己住在哪裡。
E N D
語言與資訊:釐清台灣地名厝屋 鄭錦全 2003年2月20日
本課題的研究得到許多同事的幫助。 中央研究院計算中心白璧玲女士和賴昆祺先生提供地理資訊系統的地名檔案, 語言學研究所蕭素英、江敏華、吳品慧、林千慧等同仁到新竹縣新豐鄉完成兩百戶的家庭語言調查、測量地理座標,讓我共同建構新豐鄉閩客方言分布地理資訊系統, 在此一并致謝。
語言與資訊 • 何大安先生在語言學研究所成所的海報上寫著“因為有了語言,知識成為無限”。 • 反過來說,如果沒有語言,知識很難建立。例如,沒有語言,我們就說不出自己的名字,也很難表達自己住在哪裡。 • 語言是資訊的載體,也是知識建構的基本物件和工具。 • 本文從地名來看語言和資訊的緊密聯系。
查不到‘田屋’ • 小時候在新竹縣新豐鄉鳳坑村長大, • 人在台北,想查幾個小學同學以前的居住地,看看這些年來當地道路、建築有沒有改變。 • 他們姓田,在家說海陸客家話,住在田姓小村落,地名以客家話說成‘田屋’。 • 查網路電子地圖,“蕃薯藤”電子地圖上卻查不到這個地名,網頁回應給我一個新豐鄉的地圖。
田厝 • 以閩南人的說法‘田厝’來查,查到了。
一地多名 • 同一個地點,客家人稱為‘田屋’,閩南人叫做‘田厝’,這個電子地圖用閩南人的說法訂定名稱。 • 地圖的右下角還顯示一個小村莊,叫做‘楊厝’,我小學時候住在那裡的姓楊的同學都是閩南人,地圖用‘厝’而不用‘屋’,正合當地居民自己的叫法。 • 那麼,是不是所有地圖都統一用台灣多數人口的閩南話的說法來決定地名呢?
查不到‘田厝’ • 用另外一個資訊系統查新豐鄉‘田厝’時,卻又找不到,只找到‘田屋’ • 這是中央研究院歷史語言研究所范毅軍先生及計算中心林誠謙主任在2000-01年由內政部委託執行的“臺灣地區地名查詢系統建置計畫”的“台灣地名查詢系統”
‘厝’與‘屋’的閩客來源 • 在地名沿革與文獻歷史簡述中,說到‘厝’與‘屋’的閩客來源: • ‘厝’是閩南語,‘屋’是客家話。但是近來居民遷移,造成異姓混居,因此有地名不符合姓氏或者方言的現象。 • 這裡還談到要把當地地名作為‘厝’或‘屋’的標準頗費斟酌。
‘楊厝’ • 還有一兩個小學同學家住新豐鄉上坑村, • 他們是閩南人,住家一帶叫做‘楊厝’。 • 但是中研院的“台灣地名查詢系統”卻查不到‘楊厝’,只能查到‘楊屋’。
不是當地閩南人的說法 • 這裡的地名沿革與歷史簡述同樣包括上述地名‘田屋’的相關事項以及標準化的問題, • 語言別是客家,地名發音是以海陸客家話發‘楊屋’。 • 這是客家人的名稱,不是當地閩南人的說法。
語言典藏計畫 • 新豐鄉是閩客雜居的鄉鎮,居民的方言因為婚姻和遷居而有所變化。 • 我們的語言典藏計畫的閩南語子計畫的一個目標是調查新豐鄉現時的家庭語言。 • 過去幾個月調查了兩百個家庭,建立了方言分布的地理資訊系統。 • 現在我們就用這個資料來考察鳳坑村的田屋和上坑村的楊厝的家庭方言。
航照定位 • 農林航空測量所製作的新豐鄉坑子口一帶的彩色航照圖像,可以看到鳳坑村的田屋和上坑村的楊厝兩個村莊。
閩客方言 • 我們所調查的家家戶戶的語言劃分為閩南、客家和其他方言。 • 閩客方言又細分為泉州、漳州、優勢閩南語,客家方言分海陸和四縣。
家庭語言 • 我們用向量化了的黑白航照地圖,加上所調查的家庭的方言的藍、紅標誌, • 藍色代表閩南方言,紅色代表客家話, • 本文不討論閩客方言的內部差異,因此標誌暫且不細分漳州、泉州、海陸、四縣。
閩客分布 • 在航照的實際圖片上,疊加方言的區分。 • 這裡大致可以看出‘田屋’和‘楊厝’的閩客分布, • 我們用屋宇道路地圖取代航照圖,更可以看出鳳坑村和上坑村的方言分布情形。
田屋 • 圖上的紅點顯示田屋大致是客家村落,不過,旁邊有一組籃點,那是近年來從一兩里外的海邊變成靶場時搬過來的,大都是姓鄭的閩南人,因此那一带叫做鄭厝。
47,424筆台灣地名 • 為了徹底瞭解‘屋’跟‘厝’地名在台灣的分布,我根據內政部資訊中心(2001)經建第三版地形圖數值資料檔的46,546地點名稱和878個別名,另外建立一個資料庫, • 編寫一個檢索、排比、編輯等功能的應用軟體,檢查一共47,424筆台灣地名,
經建第三版 • 從這個經建第三版地形圖數值資料檔我們畫出新豐鄉和鄰近的湖口鄉的厝屋地名分布 。
不盡符合實際 • 這圖上新豐鄉全鄉只有‘厝’而沒有‘屋’的地名,這不盡符合實際。 • 客家方言以‘屋’為地名,閩南人會以‘厝’稱呼;反之亦然,閩南人用‘厝’稱自己的地名,客家人會用‘屋’來說。
“名從主人” • 如果標準地圖因為地名報告人的方言不同而經常改變,那就失去地名的標準和規範。 • 我們建議地名的稱呼應該“名從主人”,以當地居民自己的說法為準。 • 當然,如果資料庫能有閩客不同稱呼的知識,處理查詢就可以‘屋’和‘厝’一起檢索,成為智慧型的處理。
‘屋’‘厝’雜錯 • ‘屋’‘厝’雜錯的現象大概只出現在閩客雜居的地區, • 其他地方應該不會有這樣的問題, • 我們來全盤看‘屋’‘厝’地名在台灣本島的分布。
中國大陸 • ‘厝’做為地名是閩方言的特色,我們用中央研究院計算中心所提供的中國大陸七萬多個地名檢查‘厝’與‘屋’出現的地方, • 地名是鄉鎮以上的地點。
‘屋’非客家方言獨有 • 從這個地圖可以看出带‘屋’的地名遍布許多省區, • 可見‘屋’並不是客家方言特有的地名詞語。 • ‘厝’的地名出現在福建和廣東閩方言地區。因為資料是鄉鎮以上的地名,浙江南部閩語區小村落名沒有收入, • 我們查了中國政區大典編委會(1999)浙江省蒼南縣赤溪鎮有個地方叫做‘新厝’。
‘屋’為地名 • 現在回到台灣地名來討論與‘厝’‘屋’相關的人文歷史資訊。以‘屋’為地名的筆數是94,共79種,以姓氏命名的有35筆。 • 一共用了23個姓:黃、彭、張、劉、徐、宋、石、羅、鄧、詹、葉、楊、馮、陳、莊、康、袁、邱、周、李、吳、江、安。
用‘厝’當地名 • 用‘厝’當地名的地點有 1,201 筆,不計重複,共有594 種。最高頻的20個地名是:
1 三塊厝 56 4.663% 4.663% • 2 新厝 38 3.164% 7.827% • 3 陳厝 17 1.415% 9.242% • 4 劉厝 16 1.332% 10.575% • 5 頂厝 16 1.332% 11.907% • 6 五塊厝 16 1.332% 13.239% • 7 下厝 15 1.249% 14.488% • 8 吳厝 14 1.166% 15.654% • 9 王厝 14 1.166% 16.819% • 10 黃厝 13 1.082% 17.902% • 11 後厝 12 0.999% 18.901% • 12 李厝 12 0.999% 19.900% • 13 林厝 11 0.916% 20.816% • 14 新厝子 10 0.833% 21.649% • 15 四塊厝 10 0.833% 22.481% • 16 張厝 9 0.749% 23.231% • 17 田厝 9 0.749% 23.980% • 18 羅厝 8 0.666% 24.646% • 19 葉厝 8 0.666% 25.312% • 20 曾厝 8 0.666% 25.978%
‘厝’姓氏結合的地名 • 用‘厝’當地名的地點的 1,201 筆中,有488 筆是‘厝’和姓氏結合的地名。 • 最高頻的20個姓氏地名的頻率、百分比和覆蓋率如下:
1 陳厝 17 3.484% 3.484% • 2 劉厝 16 3.279% 6.762% • 3 吳厝 14 2.869% 9.631% • 4 王厝 14 2.869% 12.500% • 5 黃厝 13 2.664% 15.164% • 6 李厝 12 2.459% 17.623% • 7 林厝 11 2.254% 19.877% • 8 張厝 9 1.844% 21.721% • 9 田厝 9 1.844% 23.566% • 10 羅厝 8 1.639% 25.205% • 11 葉厝 8 1.639% 26.844% • 12 曾厝 8 1.639% 28.484% • 13 邱厝 8 1.639% 30.123% • 14 蘇厝 7 1.434% 31.557% • 15 彭厝 7 1.434% 32.992% • 16 許厝 7 1.434% 34.426% • 17 謝厝 6 1.230% 35.656% • 18 蕭厝 6 1.230% 36.885% • 19 蔡厝 6 1.230% 38.115% • 20 詹厝 6 1.230% 39.344%
地名與姓氏統計 • 現在台灣各地人口密集,零星聚落被稱為某某厝的應該很少,以厝為名,應當源自早期地廣人稀的年代。 • 姓氏與‘厝’結合成地名跟姓氏的統計有密切的關係。
姓氏量 • 莊英章編 (1997) 《重修臺灣省通志卷三住民志姓氏篇》 • 引富田芳郎(1935)根據1930人口數字統計出十大姓氏如下:陳、林、張、王、黃、李、吳、蔡、劉、郭, • 又引陳紹馨、傅瑞德(1968)《台灣人口之姓氏分布》根據1956年人口普查資料統計姓氏量排名是:陳、林、黃、張、李、吳、王、劉、蔡、楊、許、鄭、謝、郭、洪、邱、曾、廖、賴、徐。 • 我們根據與厝結合的姓氏計量,得出高頻陳、林、劉、許、吳、王、黃、羅、莊、田、李、蘇、蔡、葉、彭、張、洪、邱、謝、曾。反應相同的文化。
字種是2,769個 • 現今地名和別名加在一起一共47,424 筆 • 所用的漢字總數是161,524個, • 字種是2,769個。 • 最高頻的20個字的覆蓋率是30.178%。
1 橋8786 5.429 5.429 • 2 中4685 2.895 8.324 • 3 山3969 2.453 10.777 • 4 心3199 1.977 12.754 • 5 動2854 1.764 14.518 • 6 活2813 1.738 16.256 • 7 大2606 1.610 17.866 • 8 宮2188 1.352 19.218 • 9 公1727 1.067 20.286 • 10 寮 1716 1.060 21.346 • 11 新 1650 1.020 22.366 • 12 坑 1627 1.005 23.371 • 13 子 1586 0.980 24.351 • 14 水 1552 0.959 25.310 • 15 場 1480 0.915 26.225 • 16 興 1358 0.839 27.064 • 17 農 1322 0.817 27.881 • 18 南 1261 0.779 28.660 • 19 號 1252 0.774 29.434 • 20 厝1205 0.745 30.178
字種組合 • 從這兩千多個字種組合成的47,424筆 • 相同的有17,309個, • 因此有30,115種不同的地名, • 最高頻的20個是:
1 活動中心 2515 5.303% 5.303% • 2 農會 434 0.915% 6.218% • 3 抽水站 72 0.152% 6.370% • 4 戶政事務所 66 0.139% 6.509% • 5 消防隊 61 0.129% 6.638% • 6 保安宮 58 0.122% 6.760% • 7 三塊厝 56 0.118% 6.878% • 8 水利工作站 55 0.116% 6.994% • 9 田寮 50 0.105% 7.100% • 10 福安宮 47 0.099% 7.199% • 11 中央山脈 45 0.095% 7.294% • 12 新莊 44 0.093% 7.387% • 13 大坑 44 0.093% 7.479% • 14 復興橋 43 0.091% 7.570% • 15 福德宮 42 0.089% 7.659% • 16 萬善堂 42 0.089% 7.747% • 17 天后宮 42 0.089% 7.836% • 18 代天府 41 0.086% 7.922% • 19 中興橋 39 0.082% 8.004% • 20 漁會 38 0.080% 8.085%
地名符合漢語構詞法 • 地名不是語言符號的隨機聚集,而是有結構,有意義,符合漢語構詞的組合。 • 例如,寺廟以寺為名的有613個,带有‘宮’字的有2,187個; • 以‘厝’為名的上文已經討論過。 • 其他如描述地表面貌的如‘糞箕湖’、‘大溪’、‘大崎腳’,都符合漢語構詞原則。
人類的語言能力 • 資料庫的漢字總數是161,524個,字種只有2,769個。 • 從有限的幾千個字演變出許許多多地名,這是人類的語言創造能力。 • 我近年來在古今文獻用字方面,看到每本書不管用多少字,所用的字種都不超過八千, • 因此提出人類語言符號認知的上限,基本詞核的數目有個涯邊盡頭。這個看法叫做“詞涯八千”
因為有了語言 • 從‘厝’‘屋’地名的結合到所有地名的結構,跟其他漢語構詞的原則完全一致。 • 從有限的成素衍生出許許多多地名和詞語, • 再從詞語衍生出詞組、句子、篇章等等,寫盡人間百態,同時也無限建構人類資訊和知識。 • 因此,因為有了語言,知識成為無限。