【数学建模 matlab 实验报告13】主成分分析
上一篇【数学建模 matlab 实验报告12】聚类分析和判别分析目录实验报告实验心得实验报告本例数据存于第14次-主成分分析.xlsx文件中问题1请根据调查资料作区域消费类型划分提示聚类分析2请利用主成分分析方法对各省的消费水平做综合评价并排序与聚类分析的结果进行对比。截图代码data xlsread(第14次-主成分分析.xlsx, Sheet1); data_std zscore(data); num_clusters 3; [cluster_idx, cluster_center] kmeans(data_std, num_clusters); [coeff, score, latent] pca(data_std); composite_score score(:,1); [score_sorted, sort_index] sort(composite_score, descend); disp(省份排序); disp(sort_index); disp(聚类结果); disp(cluster_idx);随着社会的高速发展人民的生活发生巨大的变化居民的消费水平备受关注它是反映一个国家或地区的经济发展水平和人民物质文化生活水平的综合指标。重庆市直辖十年以来居民的消费水平发生了很大的变化从而也促进了整个城市经济的发展在政府的带领下居民的消费水平不断提高生活质量越来越好。按照我国常用的消费支出分类法居民的消费水平分为食品、衣着、家庭设备用品及服务、医疗保健、交通通讯、文教娱乐及服务、居住和杂项商品与服务8个部分这8个部分代表了居民消费的各个领域下表就是重庆市10年间城镇居民人均消费的情况单位元/人。YX1X2X3X4X5X6X7X819972297.86589.62474.74164.19290.91626.21295.20199.0319982262.19571.69461.25185.90337.83604.78354.66198.9619992303.29589.99516.21236.55403.92730.05438.41225.8020002308.70551.14476.45293.23406.44785.74494.04254.1020012337.65589.28509.82334.05442.50850.15563.72246.5120022418.96618.60454.20429.60615.001065.12594.48164.2820032702.34735.01475.36459.69790.261025.99741.60187.8120043015.32779.68474.15537.95865.451200.52903.22196.7720053135.65849.53583.50629.32929.921391.11882.41221.8520063415.921038.98615.74705.72976.021449.49954.56242.26试利用主成分分析方法对10年间城镇居民人均消费情况进行分析。截图代码data [ 2297.86, 589.62, 474.74, 164.19, 290.91, 626.21, 295.20, 199.03; 2262.19, 571.69, 461.25, 185.90, 337.83, 604.78, 354.66, 198.96; 2303.29, 589.99, 516.21, 236.55, 403.92, 730.05, 438.41, 225.80; 2308.70, 551.14, 476.45, 293.23, 406.44, 785.74, 494.04, 254.10; 2337.65, 589.28, 509.82, 334.05, 442.50, 850.15, 563.72, 246.51; 2418.96, 618.60, 454.20, 429.60, 615.00, 1065.12, 594.48, 164.28; 2702.34, 735.01, 475.36, 459.69, 790.26, 1025.99, 741.60, 187.81; 3015.32, 779.68, 474.15, 537.95, 865.45, 1200.52, 903.22, 196.77; 3135.65, 849.53, 583.50, 629.32, 929.92, 1391.11, 882.41, 221.85; 3415.92, 1038.98, 615.74, 705.72, 976.02, 1449.49, 954.56, 242.26 ]; data_std zscore(data); [coeff, score, latent] pca(data_std); disp(主成分系数:); disp(coeff); disp(主成分得分:); disp(score); disp(特征值:); disp(latent); composite_score score(:,1); [sorted_score, sort_index] sort(composite_score, descend); disp(年份排序:); disp(sort_index);实验心得本次实验围绕主成分分析与聚类分析两种多元统计方法展开通过两个实操任务系统练习了数据预处理、模型构建、结果分析的完整流程深入理解了两种方法的核心原理与应用场景切实体会到统计分析在解决实际经济、民生问题中的价值在理论认知和实操能力上均获得了显著提升。实验第一个任务聚焦区域消费类型划分与综合评价要求结合聚类分析与主成分分析对各省消费数据进行分析对比。实操中我首先运用xlsread函数读取Excel数据通过zscore函数完成数据标准化这一步让我再次认识到不同消费指标的量纲差异会影响分析结果的准确性数据预处理是保障实验可靠性的前提。随后采用K均值聚类将数据划分为3类明确了不同区域的消费类型差异再通过主成分分析利用pca函数提取主成分、计算主成分得分及综合得分对各省消费水平进行排序。通过对比聚类结果与主成分排序我发现两者呈现出高度的一致性消费水平较高的省份聚为一类中等水平和较低水平的省份分别聚为另外两类这印证了两种方法的互补性——聚类分析侧重探索数据内在的分组结构主成分分析侧重将多维度数据降维实现综合评价与排序二者结合能更全面地解读数据特征。实验第二个任务针对重庆市十年间城镇居民人均消费数据运用主成分分析方法进行深入分析。该任务涉及食品、衣着、居住等8项消费指标全面反映了居民消费的各个领域。实操中我直接录入数据并完成标准化通过pca函数获取主成分系数、得分及特征值进而计算综合得分并对年份进行排序。分析结果清晰呈现了重庆市直辖十年间居民消费水平的变化趋势从综合得分排序可以看出居民消费水平整体呈逐年上升态势尤其是2002年后增长速度明显加快。结合主成分系数和特征值我进一步发现食品、交通通讯、文教娱乐等指标对居民消费水平的影响最为显著这与居民生活质量提升、消费结构优化的实际情况相符也让我理解了主成分分析在数据降维、核心影响因素提取中的优势——它能将多个相关指标转化为少数几个互不相关的综合指标简化分析过程同时保留原始数据的主要信息。通过本次实验我不仅熟练掌握了MATLAB中zscore、kmeans、pca等核心函数的用法更深刻领悟了主成分分析与聚类分析的核心逻辑。主成分分析作为一种数据降维方法有效解决了多指标分析中信息重叠、计算繁琐的问题适用于综合评价类场景聚类分析作为无监督学习方法无需预设分类标准能客观呈现数据的自然分组适用于类型划分类问题。二者在实际应用中相辅相成比如在区域经济、居民消费等领域结合两种方法既能明确分组差异又能实现综合排序为决策提供科学依据。实验过程中我也深刻认识到细节的重要性数据标准化的规范性、聚类类别数量的合理选择、主成分的提取依据都会影响实验结果的准确性。同时我也体会到统计分析并非简单的代码运行更重要的是对结果的解读能力——需结合实际场景将数据结果转化为有意义的结论才能真正发挥统计方法的价值。此次实验夯实了我对多元统计分析方法的理论基础提升了数据分析与MATLAB实操能力。在今后的学习中我将继续深化对主成分分析、聚类分析等方法的理解学会根据实际问题选择合适的统计方法不断提升数据解读与应用能力用科学的分析方法解决更多实际问题。