B题远处燃烧体物质元素含量的测定
原子是由原子核和绕核运动的电子组成的,原子核外电子按其能量的高低形成不同的能级,原子核可以具有多种能级状态。能量最低的能级状态称为基态能级,其余能级称为激发态能级。正常情况下,核外电子在各自能量最低的轨道上运动。将一定外界能量的光能提供给基态原子,当外界光能量恰好等于该基态原子中基态和某一较高能级之间的能级差时,该原子将吸收这一特征波长的光,外层电子由基态跃迁到相应的激发态,提供能量的光经分光后谱线中缺少了一些特征光谱线,产生原子吸收光谱。电子跃迁到较高能级以后处于激发态,激发态电子是不稳定的,约经过0.00000001秒以后,激发态电子将返回基态或其它较低能级,并将电子跃迁时所吸收的能量以光的形式释放出去,这个过程产生原子的发射光谱。我们还知道,可见光通常指波长范围为390nm~780nm的电磁波。人眼可见范围为312nm~1050nm。这些知识并不代表能够为解决下面的问题提供方向,同时也不一定有价值。
我们获得了不同燃烧体的部分可见光数据,并通过非常艰难的方式获得了燃烧体含有某种元素及其含量,试图通过这些数据建立元素含量与可见光数据之间的关系,从而采用一种简易的方式(即数学模型)获得数据的特定属性。显然,元素含量为0表示该燃烧体没有这种元素。这些模型的建立可以根据可见光的特征、光谱知识、燃烧知识、原子模型、量子学原理等等物理知识,建立相应的物质元素测量模型。当然,也可以完全忽略所有的知识,仅仅从某元素含量与可见光数据的样本所呈现出的隐含关系,如通过SVM(支持向量机)、PCA(主成分分析法)等等方法,来猜测这种隐含关系所对应的数学模型,从而使得这种隐含关系变成显式关系。这就是该问题需要达到的目标。
附件data0.csv、data1.csv都是逗号分隔格式的数据文件,该文件可以用记事本、写字板、Office word、WPS等任何一个文本编辑器打开。第一行为格式数据,其中no,data,x1,x2,…,x3648分别为数据的序号,碳元素的含量,245nm光强度,…,1044nm光强度。这里的光强度值是某一种固定参考强度的倍数,且x1-x3648变量的光波长差是一个常数。data0.csv、data1.csv 都是3650列数据,都包含19次试验数据。变量no即数据的序号为k表示第k次试验获得的数据。CSV格式数据可以直接用Office Excel、WPS Excel打开,可能由于版本的问题而导致数据不能全部显示。
建立数学模型,要求解决以下问题:
(1)针对data0.csv包含的数据建立变量data由变量x1-x3648计算或者估计的数据模型,可以是函数关系式、估计模型、随机关系、模式识别模型、SVM即支持向量机、主成份分析模型或者其它模型都可以,不限制模型类型。也就是建立碳元素的含量data与各个光波长对应的光强度x1,x2,…,x3648之间的关系模型。
(2)利用(1)建立的关系模型预测data1.csv包含的碳元素的含量data,并分析模型(1)预测的效果,建立类似于识别率等指标的模型(1)的评价指标模型。
(3)在(2)建立的评价指标模型和模型(1)的基础上,是否可以进一步的提高模型的性能,即能否通过修正模型(1)或建立新的模型,以提高相应的评价指标。
(4)能否通过进一步的研究,得到数据data0.csv、data1.csv包含铁元素的信息,如果有的话,试尝试建立相应的模型;若没有的话,则详细说明其理由。
原子是由原子核和绕核运动的电子组成的,原子核外电子按其能量的高低形成不同的能级,原子核可以具有多种能级状态。能量最低的能级状态称为基态能级,其余能级称为激发态能级。正常情况下,核外电子在各自能量最低的轨道上运动。将一定外界能量的光能提供给基态原子,当外界光能量恰好等于该基态原子中基态和某一较高能级之间的能级差时,该原子将吸收这一特征波长的光,外层电子由基态跃迁到相应的激发态,提供能量的光经分光后谱线中缺少了一些特征光谱线,产生原子吸收光谱。电子跃迁到较高能级以后处于激发态,激发态电子是不稳定的,约经过0.00000001秒以后,激发态电子将返回基态或其它较低能级,并将电子跃迁时所吸收的能量以光的形式释放出去,这个过程产生原子的发射光谱。我们还知道,可见光通常指波长范围为390nm~780nm的电磁波。人眼可见范围为312nm~1050nm。这些知识并不代表能够为解决下面的问题提供方向,同时也不一定有价值。
我们获得了不同燃烧体的部分可见光数据,并通过非常艰难的方式获得了燃烧体含有某种元素及其含量,试图通过这些数据建立元素含量与可见光数据之间的关系,从而采用一种简易的方式(即数学模型)获得数据的特定属性。显然,元素含量为0表示该燃烧体没有这种元素。这些模型的建立可以根据可见光的特征、光谱知识、燃烧知识、原子模型、量子学原理等等物理知识,建立相应的物质元素测量模型。当然,也可以完全忽略所有的知识,仅仅从某元素含量与可见光数据的样本所呈现出的隐含关系,如通过SVM(支持向量机)、PCA(主成分分析法)等等方法,来猜测这种隐含关系所对应的数学模型,从而使得这种隐含关系变成显式关系。这就是该问题需要达到的目标。
附件data0.csv、data1.csv都是逗号分隔格式的数据文件,该文件可以用记事本、写字板、Office word、WPS等任何一个文本编辑器打开。第一行为格式数据,其中no,data,x1,x2,…,x3648分别为数据的序号,碳元素的含量,245nm光强度,…,1044nm光强度。这里的光强度值是某一种固定参考强度的倍数,且x1-x3648变量的光波长差是一个常数。data0.csv、data1.csv 都是3650列数据,都包含19次试验数据。变量no即数据的序号为k表示第k次试验获得的数据。CSV格式数据可以直接用Office Excel、WPS Excel打开,可能由于版本的问题而导致数据不能全部显示。
建立数学模型,要求解决以下问题:
(1)针对data0.csv包含的数据建立变量data由变量x1-x3648计算或者估计的数据模型,可以是函数关系式、估计模型、随机关系、模式识别模型、SVM即支持向量机、主成份分析模型或者其它模型都可以,不限制模型类型。也就是建立碳元素的含量data与各个光波长对应的光强度x1,x2,…,x3648之间的关系模型。
(2)利用(1)建立的关系模型预测data1.csv包含的碳元素的含量data,并分析模型(1)预测的效果,建立类似于识别率等指标的模型(1)的评价指标模型。
(3)在(2)建立的评价指标模型和模型(1)的基础上,是否可以进一步的提高模型的性能,即能否通过修正模型(1)或建立新的模型,以提高相应的评价指标。
(4)能否通过进一步的研究,得到数据data0.csv、data1.csv包含铁元素的信息,如果有的话,试尝试建立相应的模型;若没有的话,则详细说明其理由。