2022高教社杯全国大学生数学建模竞赛C题详细解析

1.比赛报名与思路解析(持续更新750967193)
2.比赛时间:2022年9月15日18点到2022年9月18日20点
如下为C题思路:
C 题 古代玻璃制品的成分分析与鉴别
丝绸之路是古代中西方文化交流的通道,其中玻璃是早期贸易往来的宝贵物证。早期的玻璃在西亚和埃及地区常被制作成珠形饰品传入我国,我国古代玻璃吸收其技术后在本土就地取材制作,因此与外来的玻璃制品外观相似,但化学成分却不相同。
背景分析:第一段背景介绍了我国玻璃的背景,说明了中国与外来的玻璃制品化学成分不同。
玻璃的主要原料是石英砂,主要化学成分是二氧化硅(SiO2)。由于纯石英砂的熔点较高,为了降低熔化温度,在炼制时需要添加助熔剂。古代常用的助熔剂有草木灰、天然泡碱、硝石和铅矿石等,并添加石灰石作为稳定剂,石灰石煅烧以后转化为氧化钙(CaO)。添加的助熔剂不同,其主要化学成分也不同。例如,铅钡玻璃在烧制过程中加入铅矿石作为助熔剂,其氧化铅(PbO)、氧化钡(BaO)的含量较高,通常被认为是我国自己发明的玻璃品种,楚文化的玻璃就是以铅钡玻璃为主。钾玻璃是以含钾量高的物质如草木灰作为助熔剂烧制而成的,主要流行于我国岭南以及东南亚和印度等区域。
背景分析:这一段首先提出了助熔剂的不同对玻璃化学成分是有重要影响的,如果题目需要,其实可以量化影响程度,建立助熔剂影响数学模型。
古代玻璃极易受埋藏环境的影响而风化。在风化过程中,内部元素与环境元素进行大量交 换,导致其成分比例发生变化,从而影响对其类别的正确判断。如图 1 的文物标记为表面无风化,表面能明显看出文物的颜色、纹饰,但不排除局部有较浅的风化;图 2 的文物标记为表面风化,表面大面积灰黄色区域为风化层,是明显风化区域,紫色部分是一般风化表面。在部分风化的文物中,其表面也有未风化的区域。
背景分析:这一段主要介绍了风化的对玻璃化学成分的影响,与前文一样,后期如果需要,可以建立对应的数学模型去量化影响。
2022高教社杯全国大学生数学建模竞赛C题详细解析
文章图片

图 1 未风化的蜻蜓眼玻璃珠样品
2022高教社杯全国大学生数学建模竞赛C题详细解析
文章图片

图 2 风化的玻璃棋子样品
现有一批我国古代玻璃制品的相关数据,考古工作者依据这些文物样品的化学成分和其他 检测手段已将其分为高钾玻璃和铅钡玻璃两种类型。附件表单 1 给出了这些文物的分类信息, 附件表单 2 给出了相应的主要成分所占比例(空白处表示未检测到该成分)。这些数据的特点是成分性,即各成分比例的累加和应为 100%,但因检测手段等原因可能导致其成分比例的累加和非100%的情况。本题中将成分比例累加和介于 85%~105%之间的数据视为有效数据。
背景分析:这一段引出了这道题目的问题,相关数据即为附件给出的数据集,我们需要对数据集进行分析,从而解决问题。一般数据集需要进行预处理等一系列操作。这里C君会给出分析的附件:附件1数据集的分析与处理(在面包多附件处进行下载)。
这一段同样给出了几个重要信息:1 附件表单 1 给出了这些文物的分类信息,附件表单 2 给出了相应的主要成分所占比例(空白处表示未检测到该成分) 2 本题中将成分比例累加和介于 85%~105%之间的数据视为有效数据。(这一信息可以写入论文中的模型假设部分)有效数据之外的数据应该在一开始就进行剔除,这也是数据预处理的一部分。
请你们团队依据附件中的相关数据进行分析建模,解决以下问题:
问题 1 对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析;结合玻璃的类型,分析文物样品表面有无风化化学成分含量的统计规律,并根据风化点检测数据,预测其风化前的化学成分含量。
问题一分析:请在观看问题一分析前先观看附件1数据集的分析与处理(在面包多附件处进行下载)。针对问题1,问题1分为三小问。
首先,需要对玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析。一般分析几个指标之间的关系,通常用到的方法为相关性分析,查看不同指标之间的相关性,另外,由于仅有三个指标,所以可以用两指标为输入,第三个指标为输出,建立预测模型。这时就有3个预测模型,根据预测模型的准确率(先用所有数据进行训练,然后用模型预测,看正确的占总数的多少),可以分析得出结论,一般哪两个指标更容易预测到第三个指标是什么,哪两个不容易预测出。这时可以做一些可视化图辅助分析,这里不做具体的分析,进阶思路有样例。
其次,需要结合玻璃的类型,分析文物样品表面有无风化化学成分含量的统计规律。这里,有些人可能会陷入误区,就是仅用附件表单1中的数据进行分析,但实际,这道题目需要分析的是对于化学成分含量的统计规律,重点在有无和含量上。也就是说,怎样的玻璃类型、纹饰和颜色,对文物样品表面有无风化化学成分含量的影响。需要注意的是,题目并未给出什么成分属于风化化学成分。
所以,在做本题时,需要先建立风化化学成分模型(随便起的,自己定名字),先做完附件1 数据集分析与处理后,有两种方式建立模型:(1)通过以所有化学成分为输入,以是否风化为输出,建立预测模型,然后根据各个指标的权重,给定一个阈值,超过这一阈值则将其列为风化化学成分;(2)利用相关性分析,以与是否风化相关性高的指标为判断依据,来确定风化化学成分。
然后,探索玻璃类型与这几个风化化学成分的关系,这里给出两种方法:(1)题目问的简单,所以可以以类型特有或者显著作为判断依据,如果某一玻璃类型这一化学成分很高,或者没有,都是统计规律;(2)进行具体的分析,将类型先以附件1 数据集的分析与处理,处理为标量值,然后进行相关性分析或者前面提到的预测模型,相关性分析根据相关性数值大小判断,预测模型根据指标权重进行判断。
然后,探索玻璃类型与这几个风化化学成分的关系,这里给出两种方法:(1)题目问的简单,所以可以以类型特有或者显著作为判断依据,如果某一玻璃类型这一化学成分很高,或者没有,都是统计规律;(2)进行具体的分析,将类型先以附件1 数据集的分析与处理,处理为标量值,然后进行相关性分析或者前面提到的预测模型,相关性分析根据相关性数值大小判断,预测模型根据指标权重进行判断。最后是第三小问,根据风化点检测数据,预测其风化前的化学成分含量。这里是预测模型,这里给出一共有两种方案:(1)根据变化率判断,风化化学成分之外的化学成分可以简单根据已有数据的平均值来进行判断,因为这些受风化的影响很小。而风化化学成分有两种做法,一个是和前文一样,也根据平均值来做,另一种是建立数学模型,将所有未风化与已风化的作为两类数据,根据未风化所有数据中的所有化学成分指标,依次对所有已风化的单个已风化的指标建立预测算法,然后预测时,以单个未风化数据中的所有化学成分指标作为输入,输出对应的指标值,也就是对应的风化化学成分含量。
(2)利用决策树、随机森林等算法进行预测。
对于第一问的补充思路:
1 有人问如何填充数据,这里统一回复一下,题目中空白的数据是0,你们填0即可,不需要进行其他操作。
2 对于多种方法,可以不仅限于使用一种,可以进行融合。
3 有人问关于可视化的问题,可视化即为对数据进行合适的图形展示,更直观的辅助分析过程。比如在做相关性分析时,可以利用热力图来直观反应哪些变量之间具有强相关性(根据颜色深浅),这个要具体情况具体分析,一般要在图后进行简单的,针对图片的分析。
【2022高教社杯全国大学生数学建模竞赛C题详细解析】4 有人提出用时间序列分析、支持向量机做。这个很荒谬,哪来的数据进行训练?大家请鉴别网上的思路,有独立思考能力。决策树是可以用的。

    推荐阅读