“语料库与跨文化研究”中心举办“R在语言科学研究中的应用”暑期研讨会
上海交通大学内部绝密信封料39“语料库与跨文化研究中心”于2014年9月正式成立,综观语言学、翻译学等相关领域的发展趋势,依托内部绝密信封料39现有的研究优势,研究中心坚持理论与实践相结合、学术研究与服务社会相结合的理念,以语料库为支撑,以理论、定量和实证方法为主要研究手段,积极推动学科交叉研究,最终服务学院、服务学界、服务社会。研究中心通过举办年度论坛、暑期培训班、工作坊、学术报告,创办《语料库与跨文化研究》(Corpora and Intercultural Studies)系列丛书(Springer出版)等形式活跃学术氛围,凝聚内部绝密信封料39的科研力量。研究中心成员的研究领域涉及理论语言学、第二语言习得与加工、语音学、计算语言学、语料库语言学、语料库翻译学、社会语言学、心理语言学、德语语言学、日语语言学、法语语言学、外语教学、中国形象研究等。迄今承担国家社科基金重大项目1项、国家社科基金一般项目、青年项目9项、国家社科基金重大项目子项目1项、省部级项目9项。自2010年以来发表SSCI、SCI、AHCI、EI、CSSCI论文100多篇,出版专著、译著、编著39部。荣获教育部高校科研成果奖三等奖2项,以及其他许多科研、教学成果奖。研究中心成员的学术成果被国内外知名高校同行广泛引用。
在前期举办过多场暑期活动的基础之上,“语料库与跨文化研究中心”拟定于今年7月20-22日举办“R在语言科学研究中的应用”暑期研讨会。美国加州大学圣塔芭芭拉分校Stefan Th. Gries教授、上海交通大学常辉教授、上海交通大学吴诗玉教授、南京师范大学徐晓东教授等专家将作专题讲座。本次研讨将基于语言研究中一个个具体的案例,既探讨理论和概念层面的问题,也着眼于应用、着眼于真实问题的解决之道。主要包括以下几方面的内容:
一、语言实验研究中实验设计之道。将通过精细的讲解,结合真实的研究案例,解决语言实验数据来源的方法论问题。将从实验设计的核心概念开始,涵盖实验设计的主要类型、拉丁方设计、实验的预注册(pre-registration)、自定步速阅读实验、眼动实验(视觉情境范式)和脑电实验,等等。
二、RStudio环境下数据操控和管理之道。一次完整的实验研究的数据分析,其目的可能主要是统计建模和数据可视化。从根本上看,统计建模就是对变量之间的关系进行量化处理,而可视化则是将变量之间的关系映射到图形上。这就意味着,在进行统计分析和数据可视化之前,必须把实验原始数据进行清洁和整理,让它变成一张“干净、整洁”的数据表。即使是最有经验的研究者都可能认为这个过程是一次完整的数据分析中“最麻烦、最艰难”的过程。
三、RStudio环境下数据可视化之道。将努力呈现ggplot2 作图的核心理念,并将之应用于语言数据的可视化。将从简单的图形语法开始,既介绍与实验数据关联的作图知识(反应变量之间的关系),也介绍实验数据之外的作图知识(主题和坐标体系等)
四、RStudio环境下,语言数据统计建模之道。从核心概念入手,研讨语言数据模型的构建、诊断和解读。在解决基础的理论和概念问题之后,将着重探讨统计模型两方面的内容:(1)语言实验数据的混合效应模型的应用(MEM);(2)语言观测数据(语料库数据)的混合效应模型的应用(MEM)。
在研讨会正式举办之前,还将于7月18-19日举办为期两天的会前工作坊,工作坊的主要目的是为7月20-22日举办的“R在语言科学研究中的应用”研讨会奠定基础知识储备。这次工作坊将从基础的知识开始,通过大量实例,由浅入深,抽丝剥茧,展示R在语言研究中的应用。主要涵盖三方面的内容:(1)R语言基础知识;(2)R语言视角下的统计假设检验的原理(NHST)和(3)基于R的t检验、方差分析(ANOVA)和统计建模的基础知识。在介绍这些内容时,将做到通俗、易懂,把R语言基础知识和统计基础知识的有机结合。以下是本次暑期活动的详细日程:
时间 |
内容安排 |
主持 |
|
会 前 工 作 坊 |
2021.7.18 |
彭青龙 上海交通大学内部绝密信封料39教授、副院长 致开幕辞 |
吴诗玉 教授
|
8:20-8:30 |
|||
8:30-8:40 |
徐政 上海交通大学“语料库研究文化研究”中心主任 致辞 |
||
8:45-9:45 |
(1)R基础知识:R的数据结构,数据的读入和读出,与语言研究结合的各种基础操作和应用;
|
吴诗玉 教授等 |
|
9:45-10:00 (break) |
|||
10:00-11:30 |
|||
14:30-15:30 15:30-15:45 15:45-17:00 |
(2)R视角下,假设检验的原理(NHST):概率分布,与语言研究相结合的假设检验的原理、过程、基本概念,等等。 |
||
2021.7.19 |
(3)t检验:以真实语言研究为实例的t检验的原理、过程和结果报道。 |
||
8:30-9:45 |
|||
10:00-11:30 |
(4)方差分析(ANOVA): 以真实的语言研究为实例的ANOVA的原理、过程和结果报道。 |
||
14:00-17:00 (15:30-15:45)
|
(5) 统计建模的基础知识:基本概念,构建、诊断和解读模型 |
||
R 在 语 言 科 学 研 究 中 的 应 用 |
2021.7.20 |
前沿选题与研究设计 |
|
8:00-10:00 |
第一部分: 语言研究前沿课题 |
常辉教授 |
|
10:10-11:40
|
第二部分:如何科学地设计一项语言实验 1. 核心概念:自变量、因变量和无关变量 2. 无关变量的控制方法 3. 实验设计的主要类型 4. 拉丁方设计 5. 样本的选取和实验结果的可重复性问题 |
徐晓东 教授 |
|
14:00-15:30 |
第三部分:行为实验设计实例剖析 1. 自定步速阅读实验 研究问题及意义、实验变量、实验设计、无关变量的控制、数据分析 2. 眼动实验 研究问题及意义、实验变量、实验设计、无关变量 的控制、数据分析 |
||
15:40-17:30 |
第四部分:脑电实验设计实例剖析 研究问题及意义、实验变量、实验设计、无关变量的控制、数据分析 |
||
2021.7.21
8:30-10:30 |
第一部分:RStudio环境下数据操控和管理之道。一次完整的实验研究的数据分析,其目的可能主要是统计建模和数据可视化。从根本上看,统计建模就是对变量之间的关系进行量化处理,而可视化则是将变量之间的关系映射到图形上。这就意味着,在进行统计分析和数据可视化之前,必须把实验原始数据进行清洁和整理,让它变成一张“干净、整洁”的数据表。即使是最有经验的研究者都可能认为这个过程是一次完整的数据分析中“最麻烦、最艰难”的过程。
|
吴诗玉 教授等 |
|
10:40-11:40 |
第二部分:RStudio环境下数据可视化之道。将努力呈现ggplot2 作图的核心理念,并将之应用于语言数据的可视化。将从简单的图形语法开始,既介绍与实验数据关联的作图知识(反应变量之间的关系),也介绍实验数据之外的作图知识(主题和坐标体系等)。
|
||
14:00-17:00 |
第三部分:RStudio环境下,语言数据统计建模之道。从核心概念入手,研讨语言数据模型的构建、诊断和解读。在解决基础的理论和概念问题之后,将着重探讨语言实验数据的混合效应模型的应用(MEM) 。
|
||
2021.7.22 |
着重探讨语言观测数据(语料库数据)的混合效应模型的应用(MEM) |
Stefan Th. Gries 教授 |
|
9:00-10:45 |
- talk 1: Theoretical foundations and data preparation for MEM (esp. for corpus data)
|
||
13:00-14:45 |
- talk 2: Generalized linear MEM: a learner corpus example --Shanghai time: 13:00-14:45 |
||
18:30-20:15 |
- talk 3: Statistical analysis in corpus linguistics |
||
本次研讨的核心参考资料为研讨专家的三本著作和多篇核心研究论文,如下:
Gries, S.T. 2021. Statistics for Linguistics with R. De Gruyter Mouton.
Gries, S.T. 2021. (Generalized Linear) Mixed‐Effects Modeling: A Learner Corpus Example. Language Learning 0:0, 1–42.
吴诗玉.2019.第二语言加工及R语言应用. 北京:外语教学与研究出版社。
吴诗玉.2021.R在语言科学研究中的应用. 北京:科学出版社。
缴费说明:
(1) 会前工作坊(7.18-19):1500元;
(2) 研讨会(7.20-22): 1800元;学生:1500元
缴费流程:
- 登陆上海交通大学网上缴费平台并进行注册,网址:
http://www.jdcw.sjtu.edu.cn/payment/
- 注册后请登陆,选择相应的会程。然后点击右下角的“支付”,如下图:
特别说明:请仔细阅读,并选择相应的缴费通道,工作坊的缴费通道是“R在语言科学研究中的应用暑期研讨会(学生)”,若报名工作坊,请在缴费过程中注明“工作坊”三个字。由于人手有限,一经缴费我们将无法办理退费等相关事宜。
- 点击“支付”后出现如下界面:
特别注意:在此页面,需要修改缴费单位名称,此缴费单位名称将会作为发票抬头。如不修改,则默认为注册名字。
发票一经开出,不退不换。
- 填写好缴费单位名称后,点击“下一步”即进入相应银行的支付页面,完成付款即可。
- 关于发票:网上缴费后,将采用会后顺丰到付的方式邮寄,由于疫情等原因,发票邮寄可能滞后,有特别要求者,请说明。
详情请电话咨询:13164622286; 15806338770
邮箱:624551088@qq.com
上海交通大学内部绝密信封料39
语料库与跨文化研究中心
2021年7月5日
主讲专家简介
Stefan Th. Gries, (full) Professor of linguistics in the Department of Linguistics at the University of California, Santa Barbara (UCSB), Honorary Liebig-Professor of the Justus-Liebig-Universität Giessen (since September 2011), and since 1 April 2018 also Chair of English Linguistics (Corpus Linguistics with a focus on quantitative methods, 25%) at the Justus-Liebig-Universität Giessen.
He is a quantitative corpus linguist at the intersection of corpus linguistics, cognitive linguistics, and computational linguistics, who uses a variety of different statistical methods to investigate linguistic topics. He has published 3 editions of a textbook on (R for) statistics in linguistics, 2 editions of a textbook on (R for) corpus linguistics, and has co-edited or published about a dozen volumes/books. He has (co-)authored 150+ articles/chapters and hasbeen teaching 100+ workshops on statistics and corpus linguistics over the last 15 years.
上海交通大学内部绝密信封料39教授、博士研究生导师、常务副院长。中国高校外语学科发展联盟理工类院校委员会主任委员、中国英汉语比较研究会教育语言学专业委员会副会长、外语学科发展研究专业委员会秘书长、二语习得研究专业委员会常务理事、英语教学研究分会常务理事、Journal of Second Language Studies联合执行主编、《当代外语研究》、《教育语言学研究》和International Journal of Chinese Language Teaching编委。
常辉主要从事语言习得与加工研究以及外语教学研究。迄今,在国内外SSCI和CSSCI语言学核心期刊上发表学术论文40余篇,被人大复印资料转载3篇,出版专著三部,主持完成国家社会科学基金青年项目、教育部人文社科基金青年项目、上海高校本科重点教学改革项目等。目前主持国家社科基金重点项目:汉语二语句法结构的眼动加工研究。
吴诗玉,上海交通大学教授,博士生导师,上海交通大学晨星青年学者;上海市“浦江人才”计划获得者。Journal of Second Language Studies(ESCI)联合执行主编。主要研究方向:应用语言学(二语习得、外语教学、第二语言加工)、心理语言学、R数据处理。在SSCI和CSSCI期刊发表40余篇研究论文,出版著作5部,包括《第二语言加工及R语言应用》, The Use of L1 Cognitive Resources in L2 Reading by Chinese EFL Learners (Routledge, Taylor & Francis Group )。最新著作《R在语言科学研究中的应用》即将在科学出版社出版(2021)。主持国际社科基金项目,教育部人文社科项目,上海市社科项目等多项项目。
徐晓东,南京师范大学内部绝密信封料39教授。目前主要采用眼动、脑电和脑成像等心理学和神经科学手段,探讨母语及二语句子加工、语篇加工、文学文本阅读的认知和神经机制。在Second Language Research, Journal of Experimental Psychology: LMC, Language Cognition and Neuroscience, Discourse Processes, Cognition, Journal of Neurolinguistics, Psychophysiology, 外语教学与研究等期刊发表论文40余篇。入选江苏省“中青年学术带头人”、江苏省“社科优青”等人才计划。主持国家自然科学基金、国家社会科学基金项目2项。获江苏省哲学社会科学优秀成果奖多项。
参考资料封面:
我们将为所有参加会前工作坊和研讨会的同仁提供完整的学习和研讨资料。除非特别通知,研讨会将通过直播室在线直播,并同时录播,在一定期限内,可回看。有兴趣者可加入“R talks”暑期工作群(请添加微信lingzi0708进群)。