車萬翔

電腦學院教授
哈爾濱工業大學

車萬翔博士,哈爾濱工業大學計算機學院教授,博士生導師,斯坦福大學訪問學者,合作導師Christopher Manning教授。現任中國中文信息學會計算語言學專業委員會委員、青年工作委員會副主任;中國計算機學會高級會員、曾任YOCSEF哈爾濱主席(2016-2017年度)。在ACL、EMNLP、AAAI、IJCAI等國內外高水平期刊和會議上發表學術論文50餘篇,其中AAAI 2013年的文章獲得了最佳論文提名獎,論文累計被引用2,500餘次(Google Scholar數據),H-index值為27。出版教材 2 部,譯著 2 部。目前承擔國家自然科學基金、973等多項科研項目。負責研發的語言技術平台(LTP)已被600餘家單位共用,提供的在線“語言雲”服務已有用戶1萬餘人,並授權給百度、騰訊、華為等公司使用。2018、2019連續兩年獲CoNLL國際評測第1名。2015、2016連續兩年獲Google Focused Research Award(谷歌專註研究獎);2016年,獲黑龍江省科技進步一等獎(排名第2);2012年,獲黑龍江省技術發明獎二等獎(排名第2);2010年獲中國中文信息學會“錢偉長”中文信息處理科學技術獎一等獎(排名第2)、首屆漢王青年創新獎(個人)等多項獎勵。2017年,所主講的MOOC課程《高級語言程式設計(Python)》獲國家精品在線開放課程。

演講題目:自然语言处理新范式——基于预训练语言模型的方法

摘要

语言是人区别于动物的根本标志,具有无穷语义组合性、高度歧义性和持续进化性,准确处理自然语言是机器难以逾越的鸿沟,成为制约人工智能取得更大突破的主要瓶颈之一,也被誉为“人工智能皇冠上的明珠”。 近年来以BERT、GPT为代表的、基于超大规模生语料库的预训练语言模型异军突起,充分利用大模型、大数据和大计算,使几乎所有自然语言处理任务性能都得到了显著提升,在若干公开数据集上宣称达到或超过了人类水平, 成为了自然语言处理的新范式。本报告将首先介绍预训练语言模型的演化过程,接着介绍预训练语言模型的最新研究进展,尤其是我们在中文和多语言预训练方面的工作,最后对自然语言处理领域今后的发展趋势进行了展望。

主辦單位

協辦單位

聯絡

第六屆漢語語言與話語國際研討會

與我們聯繫

澳門大學中國語言文學系
香港理工大學中文及雙語學系