主題講者

第六屆
漢語語言與話語國際研討會

2022年12月9-10日 @ 綫上舉辦

車萬翔

電腦學院教授

哈爾濱工業大學

車萬翔博士，哈爾濱工業大學計算機學院教授，博士生導師，斯坦福大學訪問學者，合作導師Christopher Manning教授。現任中國中文信息學會計算語言學專業委員會委員、青年工作委員會副主任；中國計算機學會高級會員、曾任YOCSEF哈爾濱主席（2016-2017年度）。在ACL、EMNLP、AAAI、IJCAI等國內外高水平期刊和會議上發表學術論文50餘篇，其中AAAI 2013年的文章獲得了最佳論文提名獎，論文累計被引用2,500餘次（Google Scholar數據），H-index值為27。出版教材 2 部，譯著 2 部。目前承擔國家自然科學基金、973等多項科研項目。負責研發的語言技術平台（LTP）已被600餘家單位共用，提供的在線“語言雲”服務已有用戶1萬餘人，並授權給百度、騰訊、華為等公司使用。2018、2019連續兩年獲CoNLL國際評測第1名。2015、2016連續兩年獲Google Focused Research Award（谷歌專註研究獎）；2016年，獲黑龍江省科技進步一等獎（排名第2）；2012年，獲黑龍江省技術發明獎二等獎（排名第2）；2010年獲中國中文信息學會“錢偉長”中文信息處理科學技術獎一等獎（排名第2）、首屆漢王青年創新獎（個人）等多項獎勵。2017年，所主講的MOOC課程《高級語言程式設計（Python）》獲國家精品在線開放課程。

演講題目：自然语言处理新范式——基于预训练语言模型的方法

摘要

语言是人区别于动物的根本标志，具有无穷语义组合性、高度歧义性和持续进化性，准确处理自然语言是机器难以逾越的鸿沟，成为制约人工智能取得更大突破的主要瓶颈之一，也被誉为“人工智能皇冠上的明珠”。近年来以BERT、GPT为代表的、基于超大规模生语料库的预训练语言模型异军突起，充分利用大模型、大数据和大计算，使几乎所有自然语言处理任务性能都得到了显著提升，在若干公开数据集上宣称达到或超过了人类水平，成为了自然语言处理的新范式。本报告将首先介绍预训练语言模型的演化过程，接着介绍预训练语言模型的最新研究进展，尤其是我们在中文和多语言预训练方面的工作，最后对自然语言处理领域今后的发展趋势进行了展望。

徵稿通知會議主旨發言會議議程

主辦單位

協辦單位

聯絡

第六屆漢語語言與話語國際研討會

iscld.paper@polyu.edu.hk

與我們聯繫

澳門大學中國語言文學系

香港理工大學中文及雙語學系