课程简介
课程针对零编程基础的化学、材料学工作者设计,先扎实学习当下最流行、与机器学习契合度最高的Python语言,再学习机器学习的基本算法,并对文献案例进行重现。课程包含大量实际操作内容,掌握编程神器Python与黑科技机器学习不再遥不可及。
课程内容
课前免费提供相关Python软件的安装录像,课前完成软件安装,课上直接使用!整个课程分为8个主要部分,每个部分内容如下:
一、开始Python学习之旅!
介绍Python的功能与用途,Python近年的发展趋势、流行的原因以及其在科学数据处理、可视化方面的应用。了解Anaconda,学习Jupyter编译环境的基本使用,编写属于自己的第一个Python程序,学会查看Python错误,并根据错误提示修正代码。学会查看帮助文件。
二、学习Python的基本使用!
了解Python的基本变量、运算符、语法,学会使用Python的条件判断语句、循环语句。完成计算Fibonacci数列程序的编写。了解Python中函数的概念,会编写Python函数,并用于对可逆氢电极电势案例。学会使用Python读写文件。完成此部分的学习后,我们已经可以使用Python编写简单的程序了!
三、强大的Python库
Python的强大源于它的第三方库,此部分将开始Python库的学习!在此部分,将学会Python库的安装、导入与使用方法。对于众多的Python库,我们着重学习NumPy库、pandas库与matplotlib库,掌握它们的数据类型与使用方法。
结合Python库以及文件读写,我们已经可以编写较为复杂的Python程序,用于进行实验数据或计算文件的后处理了。我们这里将以谱数据平滑为案例,介绍数据处理的流程与实现方式。科学研究上常常将NumPy,SciPy,matplotlib等Python库结合使用,用于替代matlab、origin等商业软件进行数据处理与展示!
四、迈向机器学习!
掌握了神器Python,我们将开始我们的机器学习之旅。此部分的学习后我们对机器学习的使用有概括性的认识,了解到机器学习在化学中的主要应用领域,并将知晓机器学习在化学、材料科学研究中的优势。在这部分中,我们还会学习使用Python对数据进行可视化,这将对我们数据处理与机器学习的结果处理有很大的帮助。
此部分将学习机器学习的主要算法。对于回归算法与分类算法,将会对原理进行细致的讲解,并使用多个相关的案例对不同算法进行演示与实际操作:双金属d带中心与吸附能(单变量线性回归)、预测HER活性(多变量线性回归)、连续反应动力学(非线性回归)、有机小分子分类(决策树分类、支持向量机分类)。
高通量筛选是目前在化学中与材料科学中常用的数据利用方法,数据库也逐渐成为机器学习与材料信息学中大量数据的来源,本部分将介绍新版Materials Project的功能与使用,并介绍一些常用的材料科学数据库。
课程还将使用Python中专为材料科学打造的数据挖掘库——matminer。通过matminer,可以轻松的获取大量的催化材料、电极材料数据并进行清洗。我们将节选电极表面涂层材料的高通量筛选作为案例,进行高通量筛选的实际操作练习,部分重复文献中的高通量筛选内容。我们还将学习如何将机器学习与高通量筛选进行结合,使科研更为高效。
经过前面的学习,机器学习在我们面前已不再神秘,我们已经掌握了机器学习的基本算法,并且对部分案例进行了学习。这时,我们可以选择更多相关的案例,做更为全面的解读与重现,检验我们的学习成果!
我们选择了预测d带中心、预测体积模量作为核心案例,通过实际操作,复原整个预测过程。两个案例输入的预处理不同,使用的机器学习模型不同,这使得我们一方面巩固了我们Python与机器学习使用的基础,另一方面使得我们更透彻的了解如何将机器学习应用到实际研究之中。
到这个阶段我们已经完成了机器学习的入门了,我们知道如何将机器学习应用到本学科的研究当中。但不可否认的是,机器学习仍有很多可学习的地方,很多经典的案例因为种种原因,例如复现所需时间过长,数据集过大或尚未公开,使用较复杂模型(如:神经网络模型,该模型实操部分将于进阶课中进行)等等,并不能大家一起在课堂上完成。
对于这些案例,我们也将精选重要的部分(如当下热门的机器学习原子势,实时从头算分子动力学)进行学习与讲解,并介绍一些机器学习常用软件。使我们知晓机器学习在化学上最前沿的应用。完成了系统的学习,机器学习对我们不再神秘,并将成为我们自己的科研黑科技武器。
黄博士:华算科技全职技术专家,武汉大学本科,北京大学博士,新加坡国立大学访问学者。目前已发表SCI文章共20篇,其中第一作者文章5篇,单篇最高影响因子>40。 从事理论计算与实验化学研究工作十年,擅长使用机器学习进行化学理论的研究及实验数据的处理,曾获华中地区数学建模邀请赛三等奖,北京大学游戏AI对抗全国邀请赛第四名等相关奖项。