关于PMML的基础知识,我们在《PMML建模标准语言基础》(潘风文,潘启儒著)一书中进行了详细介绍。1997年,芝加哥伊利诺伊大学的Robert Lee Grossman博士发起设计了数据挖掘模型的开放标准语言PMML(Predictive Model Markup Language),即预测模型标记语言。PMML是一种基于XML规范的开放式挖掘模型表达语言,为不同的数据挖掘系统提供了定义和应用数据挖掘模型的方法,为大数据模型的跨平台应用提供了标准的解决方案。通过采用PMML规范,用户可在一个软件系统中创建预测模型,以符合PMML标准的文档对其进行表达,然后将其传递到另外一个应用系统中,并在该系统中对新的环境下的数据进行预测,从而实现预测模型的跨语言、跨平台应用的可移植性。作为事实上的表达预测模型的标准,目前PMML已经被IBM、SAS、NCR、FICO、NIST、Tibco等顶级商业公司所支持,同时也受到大量开源挖掘系统,如Weka、Tanagra、RapidMiner、KNIME、Orange、GGobi、JHepWork等的支持,其影响力越来越大,目前已经成为W3C的标准。