藏语研究和藏语信息处理研究在中国民族语言研究中一直备受关注,一方面因为藏语在汉藏语研究中占据重要地位,另一方面藏语历史悠久,文献资料丰富。在信息化时代,藏文在互联网上的广泛使用,使藏语研究有了新的内涵,不但要继承发扬传统语法研究,还需要研究藏语方言、古代藏语、藏语发展状况;也要开展藏语的分词、词性标注、知识挖掘、信息检索、机器翻译等应用研究。《中国民族语言研究与应用(第一辑)》的目的在于汇总有关藏语的新研究成果,包括语音、词汇、语法、方言、藏语史等基础研究和藏语计算处理等应用研究的成果,促进相关研究的交流。《中国民族语言研究与应用(第一辑)》内容适合对藏语研究感兴趣的学生和研究人员阅读。
心智层次与深度学习
代序
当代社会,信息技术是如此快速地渗入我们的工作与生活,从孤立的个人电脑到全球网络数字移动系统,人类身处的世界已再度翻篇。忆往昔,数千年前,庄子的混沌天地万物一体,无数据可言,唯思绪可鹏程万里:“风起北方,一西一东,有上彷徨,孰嘘吸是?孰居无事而披拂是?敢问何故?”察现今,拜大数据之福,世界万物关联的曙光初现,从孔仲尼到今天的你已没有那么远的时间距离,喜马拉雅山离你地理上亦不再遥不可及。工程师笑了,我有数据可计算了;哲学家笑了,我有事物可辩证了;语言学家也笑了,我有词语可聊了。大数据的精髓并非数据之多之大,实为数据之多之广,无论哪个领域、无论何种范畴,凡世界凡人类之数据之集合方可称为大数据,大数据为万物的联系本质提供了比较和计算的可能。
数据的生命在于解读,解读的方法是语言表达。可是,大数据的建立同时又带来数据芜杂难以萃取的困难,这就是大数据陷阱。好在一物降一物,人总是有办法。据我所知,在大数据概念形成过程中,人们已经发展出一种叫作深度学习的算法,这是一种机器学习的模型,具有AI性质。它的认知模型来源于心理学领域,即人脑具有深度心智结构,因此可以让机器模拟人脑神经网络,构建逐层深度学习模型。究竟何为心智深度?又如何建立深度学习模型?且举一个藏语案例。
计算语言学研究
现代藏语的机器处理及发展之路——组块识别透视语言自动理解的方法
基于条件随机场的藏文分词方法
藏语分词研究的再认识
基于网络资源的藏文未登录词识别方法
基于统计的藏语分词错误分析
藏语词语语义相似度计算软件的设计及实现
我国藏文网站的发展现状研究
基于SVM的藏语功能组块边界识别
现代藏语语气词结尾句子边界识别方法
基于部件的融合统计和结构特征的联机手写藏文字丁的识别方法
基础研究
藏语元音的Z-Norm归一化研究
书面藏语的集合化环缀s-d和s-n
古藏语非音节性名词化派生后缀的类型与功能
藏语甘孜话的数词
藏语动词byed的发展和虚化初探
敦煌吐蕃汉藏对音研究·绪论
西藏洛扎吐蕃摩崖石刻的语法特征及翻译
名著翻译
藏文标准转写方案