1 / 16

广东粤方言语音数据库的建设 邵慧君

广东粤方言语音数据库的建设 邵慧君. 一、前期准备 (一) 调查工具的制定与问题 (二) 设备硬件和录音技术指标的测定 二、调查过程 (一)对发音人的要求 (二)对记音人的要求 (三)具体录音、记音过程 三、一点思考 (一) TFW 的优势 (二) TFW 的不足. (一)调查工具的制定与问题. 拟定原则 修改过程 现存问题. 1 、拟定原则. 《 方言调查字表 》 中有而粤方言不用的字 如 “ 汝、囥、繰 ~ 边 ” 予以删除 。 《 方言调查字表 》 中无而粤方言却常用的字 如 “ 播、旭、叮 ” 等则予以增加 。. 2 、修改过程.

sakina
Download Presentation

广东粤方言语音数据库的建设 邵慧君

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 广东粤方言语音数据库的建设 邵慧君

  2. 一、前期准备 • (一)调查工具的制定与问题 • (二)设备硬件和录音技术指标的测定 • 二、调查过程 • (一)对发音人的要求 • (二)对记音人的要求 • (三)具体录音、记音过程 • 三、一点思考 • (一)TFW的优势 • (二)TFW的不足

  3. (一)调查工具的制定与问题 • 拟定原则 • 修改过程 • 现存问题

  4. 1、拟定原则 • 《方言调查字表》中有而粤方言不用的字如“汝、囥、繰~边”予以删除 。 • 《方言调查字表》中无而粤方言却常用的字如“播、旭、叮”等则予以增加 。

  5. 2、修改过程 • 删除古音地位,简化界面方便导入程序应用。 • 关于补充表:方言口语字列于末尾作为补充,包括本字、俗字形式,有音无字者暂未列入(如:“□na⁵⁵疤”,“□jɐi¹³顽劣、差” 等)。调查者需提前熟悉并准确解释。

  6. 3. 现存问题 • 字表不注古音,比对颇不方便。 • 多音字的困扰。 • 繁体字形的困扰。 化州话:甘-光 盒-鹤 洒、猫、筛、橙抹、核、盾、蚌 爲-為、併-倂 羡-羨、拼-拚、黄-黃

  7. (二)设备硬件和录音技术指标的测定 • 录音设备 • 电脑型号不限,接外置Firewire Solo声卡,配铁三角ATM73a话筒 • 录音参数 • 录音噪音值≧60 db绝对值 • 信号采样值在1500至15000 smpl之间

  8. 一、前期准备 • (一)调查调查工具的制定与问题 • (二)设备硬件和录音技术指标的测定 • 二、调查过程 • (一)对发音人的要求 • (二)对记音人的要求 • (三)具体录音、记音过程 • 三、一点思考 • (一)TFW的优势 • (二)TFW的不足

  9. (一)调查发音人的要求 • 总体要求:世居三代以上并长期居住在出生地、初中以上文化程度、年龄60以上的男性 • 吐字清晰、发音无明显生理缺陷、身体健康。耐心较好且有一定的领悟力。 • 文化程度适中,无长时间外出学习、工作的经历。

  10. (二)对记音人的要求 • 扎实的语音功底 • 必要的电脑知识 • 一定物理知识和应急能力 • 吃苦耐劳的精神和一定的沟通能力 语言田野调查软件 辅助使用录音软件 数据资料妥善备份 语音图的初步分析

  11. (三)录音、记音过程 • 1. 使用Adobe Audition监测录音环境,监测录音电平要求达到≧60 db绝对值。 • 2. 试录。选择几组具代表性的声韵调组合的字试录,调整录音参数,确保信号采样值在1500至15000 smpl之间。 • 3. 在录音过程中,要不定时进行监听,确保录音参数的一致性。

  12. (三)录音、记音过程 • 4. 整理音系。先做135个字的音系调查,并当场录入国际音标和校音,在确定了基本的声韵调系统之后再进行其余3600余字的录音。 • 5. 字表调查。最好将当天所录全部字音的音标录入TFW软件;无法当场记音的必须做好音质描写和比字情况的详细记录。 • 6. 检查录音。逐字复听,校对输入音标;查看有无漏录、错读;监听录音质量是否合格;随时记录复听结果,以便第二天重录补录。 • 7. 录音全部完成之后,进行总体校音,得出完整的声韵调系统。 • 8. 在此基础上做同音字表并分析方言音韵特点。

  13. 一、前期准备 • (一)调查调查工具的制定与问题 • (二)设备硬件和录音技术指标的测定 • 二、调查过程 • (一)对发音人的要求 • (二)对记音人的要求 • (三)具体录音、记音过程 • 三、一点思考 • (一)TFW的优点 • (二)TFW的不足

  14. (一)TFW(Tools for Field Word)的优点 • 1.突破传统调查记录的技术瓶颈,完整保留方言资料,对纯粹书面记录的方言资料起到很好的补充和印证作用,从而确保方言调查资料的可信度。 • 2. 界面设计清晰合理,每字独立切分并配合语图。 • 3.录音分步进行,方便调查者及早掌握音系概况,对于不熟悉该方言的调查者有一定帮助。 • 4.设有校音环节,方便归纳音系、校验记音错误和归纳同音字表。

  15. (二)TFW(Tools for Field Word)的不足 1. 录音字表不标注古音,不方便随时调用比 字,不如方言调查字表的韵图格式一目了 然。 2. 要求比较苛刻,工作强度较之传统的田野 调查更强。 3. 3600多字无法做归一处理后再录音,这 就难保个别字的读音由于人为因素存在一 定的偏差。而机器会忠实记录所有语音变 体,这就对后期的音系归纳整理造成困 扰。因此对调查者的要求相对更高。 4. 语音的物理特征和语音的认知听辨有一定 的差距,有时会造成分析的困扰。 5. 后续的语音分析需要对照字表古音地位逐 字进行,目前尚未做到音韵特点的自动归 纳。

  16. 请多指教!谢谢!

More Related