桂语﹝201516

关于加强中国语言资源有声数据库广西库建设数据整理有关事项的通知

各市语委、教育局,各有关高等学校:

中国语言资源有声数据库广西库建设自20125月启动以来,在专家团队和各地语委的共同努力下,取得了较大的进展,目前已完成第一批调查点采集任务的59%。但是,各调查点各种资料、数据未能按要求予以整理和提交。为了保证广西库建设数据的有效、完整和符合建设规范,请各校及专家团队对所有调查点采集的数据进行全面整理。现将有关事项通知如下:

一、各团队需在820日前保质、保量按中国语言资源有声数据库建设规范要求完成所有已调查的各点数据整理工作。未达到建设规范要求的,必须按规定重新采集。数据整理具体要求见附件。

二、根据《教育部 国家语委关于启动中国语言资源保护工程的通知》(教语信﹝20152号)文件精神,广西库建设项目今后的建设工作将纳入语保工程统筹部署,因此,今年安排的广西库建设任务暂停,待明确广西的语保工程的调查点和项目内容后再开展相关工作。

三、各市教育局、语委要做好当地已采集数据的发音人授权书登记收集工作,并积极协助专家团队做好广西库建设数据整理工作。

四、整理后所有数据资料,包括电子文档、录音录像材料、纸质材料、照片等,以及各市收集的授权书须在910日前交到自治区教育厅语工处。联系人:张华,联系电话:0771-5815389

附件:1.有声数据库广西库建设数据整理材料注意事项

      2.发音人授权书(式样)

广 西 壮 族 自 治 区  教 育 厅

广西壮族自治区语言文字工作委员会

20156月24日     

附件1

有声数据库广西库建设数据整理材料注意事项

    根据615日国家语委语保中心、北京语言大学专家审查意见,广西库建设数据应按以下要求进行整理、提交。

    一、按照中国语言资源有声数据库建设的相关规定进行整理,文件格式及目录层级内容等符合规范要求。

    二、每个调查点必须提交绿皮书纸本记录(不能使用铅笔、圆珠笔记录),并尽可能完整提供原始记音记录材料。

    三、模板表

    (一)模板表的文件不能替换,应该使用原始文件。从修改好的录音表复制的相关内容,直接拷贝到模板表原表相关位置,不得改动模板表原有条目,原表已设置保护的行、列及内容不得修改。

    (二)模板表填写的字体与字号要统一。字号统一用12号,汉字及数字字体用宋体,国际音标字体用IpaPanNew。模板表填写后的每个单元格中不能出现空格,单元格内的字符统一居左对齐。例:

1

1

ɕin33  ɕin33

须将星星及ɕin33 ɕin33之间的空格删除,改为如下:

1

1

星星

ɕin33ɕin33

   (三)各方言点整理音系的例字需要补充的,应从“绿皮书”中1000单字表选取。音系声母、韵母的排列方式参照北京大学中国语言文学系语言学教研室编《汉语方音字汇》(语文出版社2003年) 。

(四)关于记音

    1.尽量遵循汉语方言学界通行的记音方法。如[ʨ]和齐齿呼韵母相拼要记作[ʨia]等,不要记作[ʨa]

    2.模板表里的音标一律使用云龙输入法录入,字体为IpaPanNew。如果是IpaPanNew里缺的音标,应使用Unicode编码的音标。

3.声化韵的“mnŋ”一定要放在韵母的位置,声母的位置一定要写零声母,零声母须使用云龙输入法中的第8个。

4.单字表记音与音系保持一致,如有音变现象须在备注说明;词汇和语法例句、话语的转写,记实际读音。

    (四)音系说明

1.音系说明中,描写音值(包括声、韵、调)时统一用半角方括弧“[ ]”标识,如阳平[213]

2. 声调、声母及韵母的音系说明须按照其在音系中的排列顺序来描写。如:

声母

1.[n] [l]为自由变体,统一记作[l]

2.[tɕ][tɕh][ɕ]一组声母与单韵母[i]相拼时,略带舌叶音色彩。

3. [x]有时带有浊音色彩,不对立,统一记作[x]

3.连读变调要说明,必要时可列表。

4.音系说明的每一个项目都要填写,没有的项目要填上“(无)”。

(五)话语转写

1.话语转写中,发音人字、句断续处不能使用省略号,必须使用“,”分隔。

2.转写时须将语气词如实转写,并尽量选用语气词常用字。

3.时间切割中的“冒号及破折号”统一使用半角符号,如:(00:03-00:17

4.转写时句子断句尽量短,句子切割的长度不要超过两行,句子尚未说完也可以进行切割。如果切割出来的句子是三行及三行以上则需要再次切割。

(六)用字代码表

1.用字代码表的填写,要注意区分“意义”和“用例”栏的内容,避免重复。

2.对于词汇中出现的“连绵字”、“拟声词”等信息要填在“备注”栏中。

    四、录音及视频的注意事项

   (一)录音及录像文件的命名须按照绿皮书中的命名规则进行命名。

   (二)录音及录像背景噪音和语音音量

     1.背景噪音不能大于-48dB,最好控制在-60dB以下。

     2.发音人的语音音量最大值应在-18dB以上,但不要超过-6dB

附件2

中国语言资源有声数据库广西库建设发音人授权书

本人      (身份证号:              )授权国家语言文字工作委员会、本省(区、市)语言文字工作委员会、北京语言大学中国语言资源保护研究中心、本点调查团队无偿使用本人为“中国语言资源保护工程”               课题调查所提供的全部音频、视频、图片等资料。以上资料将用于国家语言资源保护事业。

授权日期自签字之日起。

授权人(签字):