在美国某州,桑德森作为埃明女士的数据分析师,他正在为埃明女士的州长竞选办公室工作。埃明女士要求桑德森采集全州选民人口统计信息,并预测选民会投票支持哪个政党,或者不会投票给任何一方。该模型还应说明哪些特征最有可能影响选民投票给埃明女士,但是埃明女士并不关心模型德过度拟合。桑德森正在使用一个选民数据集,每个记录有34个特征。他可能选择哪种分析模型来提供所要求的结果( )。
A. 聚类
B. 逻辑回归
C. 决策树
D. 线性回归

【答案及解析】B
选项A不正确,聚类是通过分析,找出数据点中相似的特征,不预先定义分类标准。选项B正确,逻辑回归有预测功能,并且通常不易过度拟合,逻辑回归也可用于规范性数据分析,确定未来行动。选项C不正确,决策树支持基于已知类别的预测,但可能容易过度拟合。选项D不正确,线性回归不是分类数据的分析方法,它需要输入连续的数据。
【视频解析】




APP下载
考试Go微信小程序
会计搜题小程序