文档说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着
文档说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库还有期末考核试题、其他网核及教学考一体化、一网一平台复习试题与答案,敬请查看。
课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)
本文由【江开搜题】微信公众号提供,禁止复制盗取,违者必究
本文由【江开搜题】微信公众号提供,禁止复制盗取,违者必究
本文由【江开搜题】微信公众号提供,禁止复制盗取,违者必究
数据挖掘技术
学校: 无
问题 1: 1. 决策树中不包含以下哪种节点( )。
选项:
A. 内部节点
B. 根节点
C. 外部节点
D. 叶结点
答案: 外部节点
问题 2: 2. 以下哪种技术对于减少数据集的维度会更好( )。
选项:
A. 删除不同数据趋势的列
B. 删除数据差异较大的列
C. 删除缺少值太多的列
D. 都不是
答案: 删除缺少值太多的列
问题 3: 3. 以下哪个聚类算法不属于基于网格的聚类算法()。
选项:
A. WaveCluster
B. BIRCH
C. MAFIA
D. STING
答案: BIRCH
问题 4: 4. 以下哪个算法是分类算法()。
选项:
A. EM
B. DBSCAN
C. C4.5
D. K-Mean
答案: C4.5
问题 5: 5. 关联规则的评价指标是( )。
选项:
A. 均方误差、均方根误差
B. Kappa统计、显著性检验
C. 支持度、置信度
D. 平均绝对误差、相对误差
答案: 支持度、置信度
问题 6: 6. 以下哪项关于决策树的说法是错误的()。
选项:
A. 寻找最佳决策树是NP完全问题
B. 冗余属性不会对决策树的准确率造成不利的影响
C. 子树可能在决策树中重复多次
D. 决策树算法对于噪声的干扰非常敏感
答案: 决策树算法对于噪声的干扰非常敏感
问题 7: 7. 一监狱人脸识别准入系统用来识别对待进入人员的身份,此系统一共包括识别4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需求( )。
选项:
A. K-中心点聚类问题
B. 二分类问题
C. 多分类问题
D. 层次聚类问题
答案: 请关注公众号【江开搜题】查看答案
问题 8: 8. 以下哪个分类方法可以较好地避免样本的不平衡问题()。
选项:
A. Bayes
B. 神经网络
C. KNN
D. SVM
答案: 请关注公众号【江开搜题】查看答案
问题 9: 9. 关于欠拟合,下面哪个说法是正确的( )。
选项:
A. 训练误差较小,测试误差较大
B. 训练误差较大,测试误差较大
C. 训练误差较大,测试误差较小
D. 训练误差不变,测试误差较大
答案: 请关注公众号【江开搜题】查看答案
问题 10: 10. 我们想在大数据集上训练决策树,为了使用较少时间,我们可以( )。
选项:
A. 增加学习率
B. 减少树的深度
C. 增加树的深度
D. 减少树的数量
答案: 请关注公众号【江开搜题】查看答案
问题 11: 11. 一般,K-NN最近邻方法在( )的情况下效果较好。
选项:
A. 样本较少但典型性好
B. 样本呈团状分布
C. 样本较多但典型性不好
D. 样本呈链状分布
答案: 请关注公众号【江开搜题】查看答案
问题 12: 12. 当分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于什么问题( )。
选项:
A. 主成分分析
B. 聚类
C. 关联规则
D. 分类
答案: 请关注公众号【江开搜题】查看答案
问题 13: 13. 简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()。
选项:
A. 模糊聚类
B. 划分聚类
C. 非互斥聚类
D. 层次聚类
答案: 请关注公众号【江开搜题】查看答案
问题 14: 14. BIRCH是一种()。
选项:
A. 特征选择算法
B. 关联分析算法
C. 分类器
D. 聚类算法
答案: 请关注公众号【江开搜题】查看答案
问题 15: 15. 以下不属于影响聚类算法结果的主要因素有( )。
选项:
A. 分类准则
B. 模式相似性测度
C. 已知类别的样本质量
D. 特征选取
答案: 请关注公众号【江开搜题】查看答案
问题 16: 16. 以下( )算法是关联规则挖掘。
选项:
A. K-Means
B. ID3
C. Apriori
D. DBSCAN
答案: 请关注公众号【江开搜题】查看答案
问题 17: 17. 惰性学习法主要包括:
选项:
答案: 请关注公众号【江开搜题】查看答案
问题 18: 18. 分类的基本过程:
选项:
答案: 请关注公众号【江开搜题】查看答案
问题 19: 19. 回归分析的步骤 。
选项:
答案: 请关注公众号【江开搜题】查看答案
问题 20: 20. 影响基本K-均值算法的主要因素有( )。
选项:
A. 聚类准则
B. 样本的数量
C. 样本输入顺序
D. 模式相似性测度
答案: 请关注公众号【江开搜题】查看答案
问题 21: 21. “点击率问题”是这样一个预测问题,99%的人是不会点击的,而1%的人是会点击进去的,所以这是一个非常不平衡的数据集。假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是( )。
选项:
A. 模型预测准确率不高,我们需要做点什么改进模型
B. 模型预测准确率已经很高了,我们不需要做什么了
C. 无法下结论
D. 以上都不对
答案: 请关注公众号【江开搜题】查看答案
问题 22: 22. 下列哪个描述是正确的( )。
选项:
A. 回归是有指导的学习,聚类是无指导的学习
B. 回归是无指导的学习,聚类是有指导的学习
C. 回归和聚类都是有指导的学习
D. 回归和聚类都是无指导的学习
答案: 请关注公众号【江开搜题】查看答案
问题 23: 23. 下列关于凝聚层次聚类的说法,说法正确的是( )。
选项:
A. 空间复杂度
B. 一旦两个簇合并,该操作还能撤销
C. 算法的终止条件是仅剩下一个簇
D. 具有全局优化目标函数
答案: 请关注公众号【江开搜题】查看答案
问题 24: 24. 分类的基本过程:
选项:
答案: 请关注公众号【江开搜题】查看答案
问题 25: 25. 支持向量机的3种模型可分为:
选项:
答案: 请关注公众号【江开搜题】查看答案
问题 26: 26. 惰性学习法主要包括:
选项:
答案: 请关注公众号【江开搜题】查看答案
问题 27: 27. 层次聚类方法可分为:
选项:
答案: 请关注公众号【江开搜题】查看答案
问题 28: 28. 回归分析的步骤
选项:
答案: 请关注公众号【江开搜题】查看答案
微信扫码添加好友
如二维码无法识别,可拨打 13662661040 咨询。