北京大学发布中华民族语言文字接触交融大数据模型_北京时间

北京大学发布中华民族语言文字接触交融大数据模型

​12月16日,在庆祝北京大学语言学实验室100周年活动中,中华民族语言文字接触交融大数据模型、国家通用语言障碍评估及干预大型系统、有声博物馆等一系列成果发布。

北京大学发布中华民族语言文字接触交融大数据模型

12月16日,在庆祝北京大学语言学实验室100周年活动中,中华民族语言文字接触交融大数据模型、国家通用语言障碍评估及干预大型系统、有声博物馆等一系列成果发布。

经过历时四年的大规模田野调查,北京大学语言学实验室发布重要研究成果——中华民族语言文字接触交融大数据模型。北京大学中文系教授、语言学实验室主任孔江平介绍:“我们现在首先是进行了大量的调查,调查后产生了大量的数据,之后我们整理后要出一套书,把中华民族各个语群里边之间的关系把它解释出来。通过这个让大家可以看到,民族语言正在融入国家的通用语言中。”

孔江平提到,该大模型对于未来国家对民族语言和文化的保留,也会有非常大的帮助。“现在到了互联网和大语言模型时期,我们又看到了语言保护的曙光。比如说我们现在做的10万句的哈尼语和汉语的对齐语料库已经完成,做完了以后拿这个马上就能跑出来一个机器翻译系统,它在大模型里边就永远保留了,之后我们就想把中国几十个少数民族的语言,它的有声文化,它的历史,它的各个方面,保存到大模型里边,这个就是我们对全人类的贡献。”

语言障碍测试平台也是本次发布的重要成果之一。该平台负责人、语言学实验室副主任吴西愉告诉记者,语言障碍会影响一个人的生活工作,而本次发布的语言障碍测试平台是希望通过测试,了解一个人出现语言障碍的原因,并根据原因给予相应干预。“因为语言障碍实际上是最后呈现出来的一个结果,但是这个结果是因为什么原因导致的我们不知道,所以我们需要去呈现障碍之后,去测试它导致这些障碍的原因,针对这个原因进行一系列干预,我们现在做的就是基于网络的一个大规模筛查平台,先在北京市的中小学里面逐步去推广这样的一个测试,将来如果效果好,我们可以推向全国。”

据了解,由实验室牵头的有声博物馆项目也同步启动建设。相关研究成果也将入藏博物馆,让声音“看得见”。

北大语言学实验室,从1925年“诞生”,它的成立标志着中国现代语音学研究的开端。100年间,实验室在人类语言涌现和演化研究、语言障碍与教育公平研究、基于人工智能的语言应用研究等方向取得了多项重大成果。

新闻广播记者胡韵卿

图片来源:官方提供

主编:马骏

北京大学发布中华民族语言文字接触交融大数据模型

​12月16日,在庆祝北京大学语言学实验室100周年活动中,中华民族语言文字接触交融大数据模型、国家通用语言障碍评估及干预大型系统、有声博物馆等一系列成果发布。

北京大学发布中华民族语言文字接触交融大数据模型

12月16日,在庆祝北京大学语言学实验室100周年活动中,中华民族语言文字接触交融大数据模型、国家通用语言障碍评估及干预大型系统、有声博物馆等一系列成果发布。

经过历时四年的大规模田野调查,北京大学语言学实验室发布重要研究成果——中华民族语言文字接触交融大数据模型。北京大学中文系教授、语言学实验室主任孔江平介绍:“我们现在首先是进行了大量的调查,调查后产生了大量的数据,之后我们整理后要出一套书,把中华民族各个语群里边之间的关系把它解释出来。通过这个让大家可以看到,民族语言正在融入国家的通用语言中。”

孔江平提到,该大模型对于未来国家对民族语言和文化的保留,也会有非常大的帮助。“现在到了互联网和大语言模型时期,我们又看到了语言保护的曙光。比如说我们现在做的10万句的哈尼语和汉语的对齐语料库已经完成,做完了以后拿这个马上就能跑出来一个机器翻译系统,它在大模型里边就永远保留了,之后我们就想把中国几十个少数民族的语言,它的有声文化,它的历史,它的各个方面,保存到大模型里边,这个就是我们对全人类的贡献。”

语言障碍测试平台也是本次发布的重要成果之一。该平台负责人、语言学实验室副主任吴西愉告诉记者,语言障碍会影响一个人的生活工作,而本次发布的语言障碍测试平台是希望通过测试,了解一个人出现语言障碍的原因,并根据原因给予相应干预。“因为语言障碍实际上是最后呈现出来的一个结果,但是这个结果是因为什么原因导致的我们不知道,所以我们需要去呈现障碍之后,去测试它导致这些障碍的原因,针对这个原因进行一系列干预,我们现在做的就是基于网络的一个大规模筛查平台,先在北京市的中小学里面逐步去推广这样的一个测试,将来如果效果好,我们可以推向全国。”

据了解,由实验室牵头的有声博物馆项目也同步启动建设。相关研究成果也将入藏博物馆,让声音“看得见”。

北大语言学实验室,从1925年“诞生”,它的成立标志着中国现代语音学研究的开端。100年间,实验室在人类语言涌现和演化研究、语言障碍与教育公平研究、基于人工智能的语言应用研究等方向取得了多项重大成果。

新闻广播记者胡韵卿

图片来源:官方提供

主编:马骏

北京时间客户端