KNN算法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:11:00
出自:国家开放大学大数据分析与挖掘技术
KNN算法在类别决策时,与极多数量的相邻样本有关。
【A.】√
【B.】×
答案是:B
更新时间:2023/6/29 19:10:00
出自:国家开放大学大数据分析与挖掘技术
KNN算法主要靠判别类域的方法来确定所属类别的,而不是靠周围有限的邻近的样本。
【A.】√
【B.】×
答案是:B
更新时间:2023/6/29 19:10:00
出自:国家开放大学大数据分析与挖掘技术
近邻选得多,模型则比较稳健。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:10:00
出自:国家开放大学大数据分析与挖掘技术
KNN算法在类别决策时,与极少量的相邻样本有关。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:10:00
出自:国家开放大学大数据分析与挖掘技术
最近邻算法中,随着近邻个数的增加,模型的复杂度增加。
【A.】√
【B.】×
答案是:B
更新时间:2023/6/29 19:10:00
出自:国家开放大学大数据分析与挖掘技术
下列关于KNN算法说法正确的是( )。
【A.】随着k值的增加,模型的复杂度增大
【B.】在实际应用中,一般采用交叉验证的方法来估计预测误差,找出使得估计的预测误差最小的k。
【C.】最近邻分类每个样本都可以用它最接近的k个邻居来
答案是:BC
更新时间:2023/6/29 19:10:00
出自:国家开放大学大数据分析与挖掘技术
如图分别为k=1,k=10,k=30时,训练集数据与测试集数据的分布,说法正确的是( )。
【A.】近邻选得越多,模型越容易受敏感点的影响。
【B.】近邻选得越少,模型越容易受敏感点的影响。
【C.】近邻选得越多,模型越稳健,但是不
答案是:BC
更新时间:2023/6/29 19:10:00
出自:国家开放大学大数据分析与挖掘技术
下列关于KNN算法说法错误的是( )。
【A.】随着k值的增加,模型的复杂度增大。
【B.】在实际应用中,一般采用交叉验证的方法来估计预测误差,找出使得估计的预测误差最小的k。
【C.】最近邻分类每个样本都可以用它最接近的k个邻居来
答案是:AD
更新时间:2023/6/29 19:10:00
出自:国家开放大学大数据分析与挖掘技术
试想有如图的两类数据,“1”点表示一类数据,“0”点表示另一类数据,当k=1时,请问图中实心的圆点(从左到右)各自属于哪一类。( )【A.】“1”;“1”
【B.】“1”;“0”
【C.】“0”;“0”
【D.】“0”;“1”
答案是:B
更新时间:2023/6/29 19:09:00
出自:国家开放大学大数据分析与挖掘技术
如图分别为k=1,k=10,k=30时,训练集数据与测试集数据的分布,说法正确的是( )
【图片】
k=1
答案是:B
更新时间:2023/6/29 19:09:00
出自:国家开放大学大数据分析与挖掘技术
下列哪一个方法适用于类域的交叉或重叠较多的待分样本集( )
【A.】决策树
【B.】随机森林
【C.】KNN算法
【D.】支持向量机
答案是:C
更新时间:2023/6/29 19:09:00
出自:国家开放大学大数据分析与挖掘技术
下列关于k近邻算法的k值,说法正确的是( )
【A.】随着k值的增加,模型的复杂程度减小,模型越稳健。
【B.】随着k值的增加,模型的复杂程度增加,模型越稳健。
【C.】随着k值的减少,模型的复杂程度增加,模型越稳健。
【D.】随着
答案是:A
更新时间:2023/6/29 19:09:00
出自:国家开放大学大数据分析与挖掘技术
如图是某数据集训练集和测试集的KNN算法的训练精度和测试精度,从图中可以判断k值取( )最为合适。
【图片】
【A.】1
【B.】5
答案是:B
更新时间:2023/6/29 19:09:00
出自:国家开放大学大数据分析与挖掘技术
每个样本都可以用它最接近的k个邻居来代表的算法是:( )
【A.】支持向量机
【B.】决策树
【C.】最近邻分类
【D.】线性判别
答案是:C
更新时间:2023/6/29 19:09:00
出自:国家开放大学大数据分析与挖掘技术
贝叶斯判别与距离判别的结果总是一样的。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:09:00
出自:国家开放大学大数据分析与挖掘技术
先验概率是根据以往经验和分析得到的概率。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:09:00
出自:国家开放大学大数据分析与挖掘技术
距离判别既没有考虑每个分类的观察值不同时,每类出现的机会是不同的,也没有考虑误判所造成的损失差异。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:08:00
出自:国家开放大学大数据分析与挖掘技术
先验概率与后验概率一定不相同。
【A.】√
【B.】×
答案是:B
更新时间:2023/6/29 19:08:00
出自:国家开放大学大数据分析与挖掘技术
贝叶斯判别既没有考虑每个分类的观察值不同时,每类出现的机会是不同的,也没有考虑误判所造成的损失差异。
【A.】√
【B.】×
答案是:B
更新时间:2023/6/29 19:08:00
出自:国家开放大学大数据分析与挖掘技术
关于下面的贝叶斯判别结果说法正确的是( )。
Setosaversicolorvirginica01.000000e+005.048809e-171.869461e-2516.250263e-1712.635294e-029.7364
答案是:ABC
更新时间:2023/6/29 19:08:00
出自:国家开放大学大数据分析与挖掘技术
下列关于贝叶斯判别和线性判别,说法错误的是( )。
【A.】贝叶斯判别考虑每个分类的观察值不同时,每类出现的机会是不同的。
【B.】贝叶斯判别与距离判别的结果总是一样的。
【C.】线性判别简单、直观且实用。
【D.】线性判别考虑了
答案是:BD
更新时间:2023/6/29 19:08:00
出自:国家开放大学大数据分析与挖掘技术
下列不是判别分析的方法( )。
【A.】距离判别
【B.】协方差阵判别
【C.】聚类判别
【D.】贝叶斯判别
答案是:BC
更新时间:2023/6/29 19:08:00
出自:国家开放大学大数据分析与挖掘技术
下列关于贝叶斯判别和线性判别,说法正确的是( )
【A.】贝叶斯判别考虑每个分类的观察值不同时,每类出现的机会是不同的。
【B.】贝叶斯判别与距离判别的结果总是一样的。
【C.】线性判别简单、直观且实用。
【D.】线性判别考虑了误
答案是:AC
更新时间:2023/6/29 19:08:00
出自:国家开放大学大数据分析与挖掘技术
对每个样本,先计算判别函数得分,然后根据先验概率和判别函数得分的条件概率,计算出该样本被判为每一类的后验概率,被判入哪一类的后验概率最大,则把样本判为哪一类。该分类方法是( )
【A.】聚类判别
【B.】决策树
【C.】贝叶斯判别
答案是:C
更新时间:2023/6/29 19:08:00
出自:国家开放大学大数据分析与挖掘技术
马氏距离既受总体空间大小的影响,也受计量单位的影响,反映了按平均水平计算被判定样本到中心的相对距离。
【A.】√
【B.】×
答案是:B
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
马氏距离不受总体空间大小的影响,也不受计量单位的影响,反映了按平均水平计算被判定样本到中心的相对距离。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
通常情况下,线性判别(距离判别)一般采用马氏距离。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
马氏距离实质上是经过标准化的变量的欧氏距离。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
样品和哪个总体距离最近,就判它属于哪个总体的分类方法是:( )
【A.】支持向量机
【B.】决策树
【C.】最近邻分类
【D.】线性判别
答案是:D
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
请为名词选择①-④表示其含义的描述,将配好的A-D填写到括号中。
【A.】①真正类 -> -> 如果一个点属于负类并且被预测到正类中
【B.】②假正类 -> -> 如果一个点属于正类并且被预测到正类中
【C.】③真负类 -> -> 如
答案是:B,A,D,C
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
关于混淆矩阵,如果一个点属于负类并且被预测到负类中,称为:( )
【A.】真正类;
【B.】假正类;
【C.】真负类;
【D.】假负类。
答案是:C
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
关于混淆矩阵,如果一个点属于正类并且被预测到正类中,称为:( )
【A.】真正类;
【B.】假正类;
【C.】真负类;
【D.】假负类。
答案是:A
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
关于混淆矩阵,如果一个点属于负类并且被预测到正类中,称为:( )
【A.】真正类;
【B.】假正类;
【C.】真负类;
【D.】假负类。
答案是:B
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
关于混淆矩阵,如果一个点属于正类并且被预测到负类中,称为:( )
【A.】真正类;
【B.】假正类;
【C.】真负类;
【D.】假负类。
答案是:D
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
判别规则所依据的最简单的原则是,新样本离哪一个类别中心的距离最近,那么它就属于哪一类。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:07:00
出自:国家开放大学大数据分析与挖掘技术
所有针对于二分类问题的模型都可以直接应用于多分类问题。
【A.】√
【B.】×
答案是:B
更新时间:2023/6/29 19:06:00
出自:国家开放大学大数据分析与挖掘技术
如果已知或假定总体服从一定的分布,则可以使用参数判别规则,反之则可以使用非参数判别规则。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:06:00
出自:国家开放大学大数据分析与挖掘技术
判别分析的核心是建立判别法则。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:05:00
出自:国家开放大学大数据分析与挖掘技术
分类和回归的根本区别在于,分类的解释变量Y是一个一维的定性变量或离散变量。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:04:00
出自:国家开放大学大数据分析与挖掘技术
分类任务就是通过学习得到一个目标函数f,一个把自变量空间映射到因变量空间的函数,我们称该目标函数为决策函数或判别函数。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:04:00
出自:国家开放大学大数据分析与挖掘技术
根据已知或假定总体是否服从一定的分布(如多元正态分布),可以将判别分析的判别规则分为( )。
【A.】两组判别分析
【B.】参数判别规则
【C.】非参数判别规则
【D.】多组判别分析
答案是:BC
更新时间:2023/6/29 19:04:00
出自:国家开放大学大数据分析与挖掘技术
针对于多分类问题,我们可以采取哪些方法。( )
【A.】“一对一”,对于两两的类别组合,建立【图片】个二分类模型;
【B.】选择可以直接进行多分类的模型;
【C.】直接使用针对二分类问题的模型;
【D.】“一对其他”,给每个类别与
答案是:ABD
更新时间:2023/6/29 19:04:00
出自:国家开放大学大数据分析与挖掘技术
下列属于分类算法的是( )。
【A.】决策树
【B.】Kmeans
【C.】最近邻分类
【D.】支持向量机
答案是:ACD
更新时间:2023/6/29 19:04:00
出自:国家开放大学大数据分析与挖掘技术
下列不属于分类算法的是( )。
【A.】决策树
【B.】Kmeans
【C.】最近邻分类
【D.】支持向量机
答案是:B
更新时间:2023/6/29 19:04:00
出自:国家开放大学大数据分析与挖掘技术
根据从不同总体中随机抽取出来的不同样本,在分析样本特征的基础上建立一定的判别法则,根据新的样本特征和判别法则判别新样本应该来自哪一个总体的是:( )
【A.】回归分析
【B.】聚类分析
【C.】主成分分析
【D.】判别分析
答案是:D
更新时间:2023/6/29 19:04:00
出自:国家开放大学大数据分析与挖掘技术
计数模型的离散因变量的数字是没有数值含义的。
【A.】√
【B.】×
答案是:B
更新时间:2023/6/29 19:04:00
出自:国家开放大学大数据分析与挖掘技术
计数模型的离散因变量的数字是有数值含义的,即次数之间可以进行数学运算。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 19:04:00
出自:国家开放大学大数据分析与挖掘技术
对于Poisson回归模型,可以使用极大似然估计进行参数估计。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 15:52:00
出自:国家开放大学大数据分析与挖掘技术
为监测某厂家生产的某款激光打印机的质量问题,考察该款打印机发生故障的次数。其发生故障的次数可能会受到打印纸张数量(千页)、打印机使用时长(千小时)、硒鼓(原装/兼容)等因素的影响。收集数据后的分析结果如下:
&
答案是:ABC
更新时间:2023/6/29 15:52:00
出自:国家开放大学大数据分析与挖掘技术
下面关于Poisson回归模型说法不正确的是( )
【A.】又称为计数模型
【B.】假设观测因变量数据服从Poisson分布
【C.】使用极大似然法进行参数估计
【D.】模型不需要进行检验
答案是:ABC
更新时间:2023/6/29 15:51:00
出自:国家开放大学大数据分析与挖掘技术
对于某个时间、空间等范围内事情发生次数的计数数据,一般都认为其近似服从( )。
【A.】卡方分布
【B.】韦布尔分布
【C.】标准正态分布
【D.】泊松分布
答案是:D
更新时间:2023/6/29 15:51:00
出自:国家开放大学大数据分析与挖掘技术
依据离散因变量选项的含义和次序的不同,可以将多重选择模型分为( ).
【A.】ordinal probit模型
【B.】有序模型
【C.】无序模型
【D.】ordinal logit模型
答案是:BC
更新时间:2023/6/29 15:51:00
出自:国家开放大学大数据分析与挖掘技术
对于分析多个属性的离散因变量与自变量的关系的模型是( )。
【A.】线性概率模型
【B.】计数模型
【C.】二元选择模型
【D.】多重选择模型
答案是:D
更新时间:2023/6/29 15:51:00
出自:国家开放大学大数据分析与挖掘技术
在多重选择模型中,对于无序选择模型,一般假定随机误差项是独立同分布的随机变量,且假定服从( )。
【A.】卡方分布
【B.】均匀分布
【C.】标准正态分布
【D.】韦布尔分布
答案是:D
更新时间:2023/6/29 15:51:00
出自:国家开放大学大数据分析与挖掘技术
二元选择模型的的参数估计结果可以理解为自变量变动对因变量的边际影响,应当理解为自变量的变动。
【A.】√
【B.】×
答案是:B
更新时间:2023/6/29 15:51:00
出自:国家开放大学大数据分析与挖掘技术
二元选择模型的因变量中的“0”和“1”只是对应属性的标注或符号,不具备任何数值上的意义,不直接进行数学运算。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 15:51:00
出自:国家开放大学大数据分析与挖掘技术
二元选择模型的的参数估计结果不能理解为自变量变动对因变量的边际影响,应当理解为自变量的变动,对因变量取“1”的概率的影响有多大。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 15:51:00
出自:国家开放大学大数据分析与挖掘技术
隐变量是不能直接进行观测,但可以通过其他直接观测得到的变量(显变量)进行描述和反映的变量。
【A.】√
【B.】×
答案是:A
更新时间:2023/6/29 15:51:00
出自:国家开放大学大数据分析与挖掘技术
二元选择模型的因变量中的“0”和“1”可以直接进行数学运算。
【A.】√
【B.】×
答案是:B
更新时间:2023/6/29 15:51:00
出自:国家开放大学大数据分析与挖掘技术 目前为: 3/9 页 首页 上页 下页 尾页