全书分为三个主要部分,第一部分在比较狭义的角度考察人工智能尤其是机器学习在科学发现中的作用,给出机器学习能够达到的科学发现的层级,并提出一个在当前的技术条件下可能的发现新概念和新思想的路径。第二部分是在更加广义上从科学哲学的角度去看机器学习与科学活动,基于对科学发现逻辑的分析和科学理论结构的分析,尝试从一种基于数学认知的科学实践哲学的角度回答自动科学发现是否可能。第三部分是案例研究,主要用机器学习模型和科学史上两个经典的科学革命的案例——与相对论相关的以太漂移问题以及与量子力学相关的黑体辐射问题——的历史数据,来模拟机器学习是否能够在真实的科学发现场景给人类带来新的概念和思想,并给第一部分的结论作为支撑。
王东的近著《人工智能与科学发现:一种哲学探究》即将付梓。人工智能和科学发现都是当下最热的课题,但把这两者结合起来讨论,还是一件别开生面的事情,有助于引出许多更深的思考。对这本著作的出版,我很乐意表示支持和祝贺。
历经数次起伏,人工智能在2012年以深度学习为标志再次崛起,借助数据、算法和算力快速发展,并迅速商业落地,在众多领域展现出惊人的能力。在深度学习崛起的十年后,2022年12月,人工智能企业OpenAI发布了现象级的聊天对话模型ChatGPTChatGPT在短短2个月内累积到1亿用户,并打破历史纪录。,再次点燃了人们对通用人工智能的激情。像GPT-4这样理解人类语言并具有一定逻辑推理能力的大规模语言模型的问世,预示着通用人工智能时代的到来。人工智能,就像当初的电力、计算机及其网络一样,将成为人类社会新的基础设施。
人工智能与科学发现,这两个领域在这十年间也产生了越来越多的交集。可以期待,我们将走向一种基于数据和智能的、更加快速和自动化的科学发现和技术创新。人工智能现在可以精准预测蛋白质折叠甚至帮助创造新蛋白质,发现新的化学结构,帮助解决量子多体问题。从随处可见的人脸识别,到已经上路的自动驾驶汽车,人工智能已经广泛且深度地渗透到人类社会的各个角落并快速改变我们的生活。随着科研活动中实验仪器的不断智能化,数据的产生和分析也在不断地自动化,在可预见的未来,大部分科学实践流程中的工作都会有人工智能辅助甚至被人工智能代替。
同时,科学发现活动作为近现代人类文明发展的重要驱动力,也在与人工智能的交融中展现出新的活力和可能性。从帮助科学家在大型粒子对撞机的海量数据中找寻上帝粒子,到参与可控核聚变装置的设计和调控,人工智能正在深刻地改变科学研究和技术创新的方式。人工智能不仅可以加速科学计算、分析科学数据和模拟复杂系统,甚至可以基于数据自动地做出科学发现。种种人工智能科学家也被构造出来重新发现历史上的重要科学理论,同时被期待着有一天能够发现新的重大理论甚至获得诺贝尔奖。
《人工智能与科学发现:一种哲学探究》一书正是在这样的背景下应运而生,为我们提供了一个科学哲学的视角去审视这些问题。作者梳理和分析了人工智能应用于科学发现的各类研究,提出科学发现可以分为现象、经验定律、构造性理论和原理性理论这四个层级。作者虽然认为当前人工智能只能发现新现象和经验定律,科学再发现研究因为其数据来源问题无法说明人工智能有发现科学理论的能力,但不同于大多数科学哲学家认为机器学习在理论上也无法发现新理论,作者提出在特定的科学情景下,机器学习可以发现新的构造性理论甚至是原理性理论。为此,基于科学史上著名的测量以太风案例,作者构建了AI-Einstein模型,试图用经验的方法论证其观点。
本书可分为三个部分。第一部分从经验的角度考察人工智能尤其是机器学习在科学发现中的作用,分析机器学习当前能够达到的科学发现的层级,提出一个在当前的技术条件下用机器学习发现新概念和新思想的路径。第二部分对科学哲学中的科学理论结构研究进行综述和分析,尝试从一种基于具身数学认知的科学实践哲学的角度,分析机器的科学发现与人类的科学发现之间的关系。第三部分是案例研究,用科学史上的经典案例——相对论相关的以太漂移——的历史数据作为训练数据,看机器学习能否在真实的科学发现场景中带来新的概念和思想,为第一部分提出的设想提供实证支持。
本书是作者近几年跟随人工智能以及数据和智能驱动科学发展的一个研究集合。虽然书名为“人工智能与科学发现”,但并不涉及人工智能的所有领域,而主要关注人工智能中的机器学习与科学发现之间的关系。科学是近代以来人类发展中最重要的活动,科学发现被看作是对知识甚至是对“真理”的最有效的生产方法。人工智能与科学发现的哲学研究是一个广阔的话题,本书仅仅涉及其中的一小部分,自然不可能企图做一个大而全的刻画。
人工智能在科学活动中的新应用不仅在技术层面上产生了深远的影响,也在理论层面上提出了一系列新的问题和挑战。对于人类最引以为傲的科学,人工智能究竟能够扮演什么角色,能否替代人类科学家?机器的科学发现是否与人类的科学发现一样,还是能够超越人类的认知达到我们无法理解的层级?人工智能能否理解科学理论,能否发现新理论甚至带来新一轮科学革命?这些问题引发了一系列的争论,有人乐观有人悲观,更多人持审慎态度。而对于哲学来说,基于传统的科学实践活动发展出来的各种科学哲学理论,以及诸如科学的本质、科学理论的结构、科学发现的逻辑、理论与经验的关系等话题,在当前智能驱动科学发现的大背景下也都需要重新去思考。作者认为,尤其是在我们还未彻底破解人工智能模型的黑箱之时,对智能驱动的科学发现不能盲目乐观并不加限制地使用,而需要在了解其具体机制的前提下进行多维度的审度。
人工智能与科学发现的关系是当代非常重要的话题,作者王东曾在我名下攻读博士,我很高兴他不断进取,毕业后又做了许多有益的尝试和探究。随着人工智能的发展,相关的应用和问题会不断涌现,我期待看到更多关于这个主题的研究,也期待人工智能赋予人类科学发现更多的可能性。
刘大椿
2023年夏于中国人民大学宜园
王东,哲学博士,北京工商大学马克思主义学院讲师。主要研究方向为人工智能哲学和认知科学哲学。在《哲学动态》《自然辩证法研究》《自然辩证法通讯》《科学技术哲学研究》等期刊发表多篇论文。
第1部分机器学习与科学发现的层级
第1章智能驱动的科学发现
1.1智能驱动的科学新发现
1.1.1天文学、宇宙学
1.1.2物理学
1.1.3生物学与医学
1.1.4数学
1.2基于人工智能的科学再发现研究
1.2.1早期自动科学再发现研究
1.2.2发现科学概念
1.2.3发现科学公式
1.3当前智能驱动科学发现的局限
第2章机器学习
2.1机器学习简介
2.2人工神经网络
2.2.1从人工神经元到感知机
2.2.2前馈多层神经网络及其通用性
2.3降维与自编码器
2.4符号回归
2.5人工智能的可解释性
第3章人工智能与科学发现的层级
3.1科学发现、科学知识及其种类
3.2科学发现的种类和层级
3.3智能驱动科学发现的层级
3.3.1当前人工智能能够达到的发现的层次
3.3.2一种特殊科学发现情形下的机器学习
第4章数据与智能驱动科学发现相关的争论
4.1数据密集型科学发现及其哲学讨论
4.1.1问题的提出与争议
4.1.2争论中存在的问题
4.1.3从认知的角度考察数据在科学活动中的作用
4.2智能驱动科学发现与自动科学发现的哲学讨论
4.2.1方法论相关争议
4.2.2方法论争论的原因分析
第1部分的问题讨论
第2部分机器学习与科学发现的关系
第5章科学理论的结构和内容
5.1何为科学理论
5.2形式化重构的观点
5.2.1语法的观点
5.2.2语义的观点
5.2.3通过范畴提升对语法与语义的同构
5.3语用——实践的观点及其认知进路
第6章科学与数学认知
6.1数学在自然科学中不可思议的有效性
6.2数学认知
6.3基于认知语言学的具身数学认知
6.3.1理论
6.3.2具身数学认知的哲学观——自然主义的
反实在论
6.3.3数学作为同构的认知过程及其问题
6.4应用——自由落体定律的负数解
6.4.1为何二次方程会有两个解
6.4.2为何在应用到自由落体中时要舍去负数解
第7章机器学习与科学发现过程
7.1科学实践过程的同构
7.2机器学习与发现的逻辑
7.3认知同构理论的问题
第3部分案例研究
第8章语言模型与科学发现
8.1预训练大规模语言模型及其能力
8.2大语言模型与自动科学发现
8.2.1大语言模型与智能驱动科学发现
8.2.2大语言模型与自动科学发现
8.2.3大语言模型实现科学发现的具体路径
第9章科学史案例建模研究
9.1以太相关现象与理论
9.1.1光行差
9.1.2斐索流水实验
9.1.3迈克尔逊莫雷实验
9.2机器学习建模
9.2.1模型1.0(带预设)
9.2.2AI-Einstein 2.0——无预设
后记
参考文献