美国宾大LDC语料库的系列讲座与培训
美国宾大Linguistic Data Consortium(LDC)科研副主任袁家宏博士将于5月3日至5月7日为我院师生开设有关语料库的系列讲座与培训。
袁家宏,2004年获康乃尔大学语言学博士学位;2004年至2005年在斯坦福大学从事博士后研究。2005年至2012年任宾西法尼亚大学语言学系助理教授,语音学实验室主任。2012年至今任宾西法尼亚大学语言资源联盟(LDC)副主任,主管语音研究。袁家宏的主要研究方向是大语料库语音学,语音识别,以及语音技术在语音学研究中的应用。其开发的语音强制对齐软件被广泛应用于语音学,心理学以及社会语言学等研究领域。袁家宏是大数据语音学的倡导者,从2005年开始开设大数据语音学方面的课程,并于2011年发起召开了首届关于大数据语音学的国际研讨会。曾主持或合作主持包括美国国家科学基金(NSF)和英国经济和社会研究理事会(ESRC)等的多项科研项目。
讲座分为两大部分。
第一部分介绍LDC及LDC的语料库资源。
第二部分介绍语料库研究的工具和方法,主要包括:
1) Python编程语言基础和Python在语料库研究中的应用;
2) 机器学习在语料库研究中的应用(以R为例);
3) 语音强制对齐技术和语音强制对齐软件P2FA (Penn Phonetics Forced Aligner) 。
讲座将面向初学者,以实际语料为例,通过具体实验讲解和演示,教会大家如何运用编程语言和机器学习的方法对数据进行处理和分析。
具体日程如下:
时间 |
地点 |
内容 |
5月3日(周三) 上午 8:30-11:30 |
214室 |
CHINESE TIMIT 语料设计和录音实验 |
5月3日(周三)下午 13:30-15:30 |
111室 |
美国宾大LDC及LDC语料库资源介绍 |
5月4日(周四) 8:30-16:30 |
214室 |
Python编程语言基础
|
5月5日(周五) 8:30-16:30 |
214室 |
Python编程语言基础
|
5月6日(周六) 8:30-16:30 |
214室 |
语音强制对齐和语音强制对齐软件P2FA
|
5月7日(周日) 8:30-16:30 |
214室 |
机器学习方法和R |
联系人:跨语言处理与语言认知基地 丁红卫 (hwding@sjtu.edu.cn)
欢迎学院的老师与同学(博士生、硕士生、本科生)踊跃参加。