共25道题 总分:100分
一、单选题(共15题,60分)
1.项集 S ={尿布,啤酒,牛奶,可乐},则项集S称为
A、1项集
B、2项集
C、3项集
D、4项集
2.决
作业 考核 论文 答案 一请联系 微--xhmcz122
Q-210969415
《大数据技术与应用》作业3
共25道题 总分:100分
一、单选题(共15题,60分)
1.项集 S ={尿布,啤酒,牛奶,可乐},则项集S称为
A、1项集
B、2项集
C、3项集
D、4项集
2.决策树生成过程中,以信息增益率作为特征选择准则生成决策树的算法是
A、ID3
B、C4.5
C、CART
D、以上都不对
3.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为
A、2
B、4
C、6
D、8
4.从软件库中导入LOF异常检测算法类的语句是
A、from sklean.neighbors import LocalOutlierFactor
B、clf=LocalOutlierFactor(n_neighbors=20)
C、y_pred=clf.fit_predict(X)
D、X_scores = clf.negative_outlier_factor_
5.数据等级排序T的是
A、定距等级>定比等级>定类等级>定序等级
B、定比等级>定序等级>定距等级>定类等级
C、定比等级>定距等级>定序等级>定类等级
D、定比等级>定类等级>定序等级>定距等级
6.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句
A、from sklean.neighbors import LocalOutlierFactor
B、clf=LocalOutlierFactor(n_neighbors=20)
C、y_pred=clf.fit_predict(X)
D、X_scores = clf.negative_outlier_factor_
7.不包含任何项的项集是指
A、项
B、空集
C、超项集
D、子项集
8.从软件库中导入模糊C均值聚类算法类的语句是
A、from fcmeans import FCM
B、fcm=FCM(n_clusters=3)
C、fcm.fit(X)
D、fcm_labels=fcm.u.argmax(axis=1)
9.如果一个项集包含K个项,则该项集称为
A、项
B、空集
C、超项集
D、K项集北语答案请进:
10.利用pandas处理数据缺失值时,用于丢弃重复值的函数为
A、drop_duplicates
B、duplicated
C、fillna
D、dropna
11.常用于多变量噪声值(异常值)处理的方法是
A、等深分箱
B、聚类法
C、等宽分箱
D、盖帽法
12.数据集{1,2,3,5,7,9}的中位数是
A、3
B、5
C、7
D、4
13.利用pandas处理数据缺失值时,用于发现缺失值的函数为
A、isnull
B、head
C、tail
D、info
14.关联规则 X→Y 表示中Y称为
A、前件
B、后件
C、中间件
D、以上都不对
15.数据集{1,2,2,2,3,4}的众数是
A、1
B、2
C、3
D、4
二、多选题(共5题,20分)
1.聚类分析可以用于
A、顾客分组
B、分类
C、回归
D、找出显著影响
2.关联规则反映的是
A、可分类性
B、可分割性
C、事物之间相互依存性
D、事物之间相互关联性
3.大数据收集的途径包括()
A、互联网
B、移动互联网
C、物联网传感器
D、手动
4.可用于实现数据one-hot编码的方法包括
A、Pandas的head
B、Pandas的get_dummies
C、sklearn.preprocessing.OneHotEncoder方法
D、Pandas的tail
5.决策树的关键点包括
A、采用Bagging框架
B、采用随机特征选择生成每个决策树的训练数据特征子集
C、采用采样数据集的特征子集训练对应决策树
D、以上都不对
三、判断题(共5题,20分)
1.定类数据层次比定序数据高
A、对
B、错
2.数据挖掘的过程都是有统一一致的步骤的
A、对
B、错
3.定序数据层次比定距数据高
A、对
B、错
4.下四分位数是指 数据从大到小排列排在第25%位置的数字,即最小的四分位数(下四分位数)
A、对
B、错
5.上世纪 70 年代,随着数据库管理系统趋于成熟,存储和查询百万兆字节甚至千万亿字节成为可能。而且,数据仓库允许用户从面向事物处理的思维方式向更注重数据分析的方式进行转变。因此,提取复杂深度系信息能力非常强啊
A、对
B、错
《大数据技术与应用》作业3
共25道题 总分:100分
一、单选题(共15题,60分)
1.项集 S ={尿布,啤酒,牛奶,可乐},则项集S称为
A、1项集
B、2项集
C、3项集
D、4项集
2.决策树生成过程中,以信息增益率作为特征选择准则生成决策树的算法是
A、ID3
B、C4.5
C、CART
D、以上都不对
3.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为
A、2
B、4
C、6
D、8
4.从软件库中导入LOF异常检测算法类的语句是
A、from sklean.neighbors import LocalOutlierFactor
B、clf=LocalOutlierFactor(n_neighbors=20)
C、y_pred=clf.fit_predict(X)
D、X_scores = clf.negative_outlier_factor_
5.数据等级排序T的是
A、定距等级>定比等级>定类等级>定序等级
B、定比等级>定序等级>定距等级>定类等级
C、定比等级>定距等级>定序等级>定类等级
D、定比等级>定类等级>定序等级>定距等级
6.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句
A、from sklean.neighbors import LocalOutlierFactor
B、clf=LocalOutlierFactor(n_neighbors=20)
C、y_pred=clf.fit_predict(X)
D、X_scores = clf.negative_outlier_factor_
7.不包含任何项的项集是指
A、项
B、空集
C、超项集
D、子项集
8.从软件库中导入模糊C均值聚类算法类的语句是
A、from fcmeans import FCM
B、fcm=FCM(n_clusters=3)
C、fcm.fit(X)
D、fcm_labels=fcm.u.argmax(axis=1)
9.如果一个项集包含K个项,则该项集称为
A、项
B、空集
C、超项集
D、K项集
10.利用pandas处理数据缺失值时,用于丢弃重复值的函数为
A、drop_duplicates
B、duplicated
C、fillna
D、dropna
11.常用于多变量噪声值(异常值)处理的方法是
A、等深分箱
B、聚类法
C、等宽分箱
D、盖帽法
12.数据集{1,2,3,5,7,9}的中位数是
A、3
B、5
C、7
D、4
13.利用pandas处理数据缺失值时,用于发现缺失值的函数为
A、isnull
B、head
C、tail
D、info
14.关联规则 X→Y 表示中Y称为
A、前件
B、后件
C、中间件
D、以上都不对
15.数据集{1,2,2,2,3,4}的众数是
A、1
B、2
C、3
D、4
二、多选题(共5题,20分)
1.聚类分析可以用于
A、顾客分组
B、分类
C、回归
D、找出显著影响
2.关联规则反映的是
A、可分类性
B、可分割性
C、事物之间相互依存性
D、事物之间相互关联性
3.大数据收集的途径包括()
A、互联网
B、移动互联网
C、物联网传感器
D、手动
4.可用于实现数据one-hot编码的方法包括
A、Pandas的head
B、Pandas的get_dummies
C、sklearn.preprocessing.OneHotEncoder方法
D、Pandas的tail
5.决策树的关键点包括
A、采用Bagging框架
B、采用随机特征选择生成每个决策树的训练数据特征子集
C、采用采样数据集的特征子集训练对应决策树
D、以上都不对
三、判断题(共5题,20分)
1.定类数据层次比定序数据高
A、对
B、错
2.数据挖掘的过程都是有统一一致的步骤的
A、对
B、错
3.定序数据层次比定距数据高
A、对
B、错
4.下四分位数是指 数据从大到小排列排在第25%位置的数字,即最小的四分位数(下四分位数)
A、对
B、错
5.上世纪 70 年代,随着数据库管理系统趋于成熟,存储和查询百万兆字节甚至千万亿字节成为可能。而且,数据仓库允许用户从面向事物处理的思维方式向更注重数据分析的方式进行转变。因此,提取复杂深度系信息能力非常强啊
A、对
B、错
《大数据技术与应用》作业3
共25道题 总分:100分
一、单选题(共15题,60分)
1.项集 S ={尿布,啤酒,牛奶,可乐},则项集S称为
A、1项集
B、2项集
C、3项集
D、4项集
2.决策树生成过程中,以信息增益率作为特征选择准则生成决策树的算法是
A、ID3
B、C4.5
C、CART
D、以上都不对
3.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为
A、2
B、4
C、6
D、8
4.从软件库中导入LOF异常检测算法类的语句是
A、from sklean.neighbors import LocalOutlierFactor
B、clf=LocalOutlierFactor(n_neighbors=20)
C、y_pred=clf.fit_predict(X)
D、X_scores = clf.negative_outlier_factor_
5.数据等级排序T的是
A、定距等级>定比等级>定类等级>定序等级
B、定比等级>定序等级>定距等级>定类等级
C、定比等级>定距等级>定序等级>定类等级
D、定比等级>定类等级>定序等级>定距等级
6.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句
A、from sklean.neighbors import LocalOutlierFactor
B、clf=LocalOutlierFactor(n_neighbors=20)
C、y_pred=clf.fit_predict(X)
D、X_scores = clf.negative_outlier_factor_
7.不包含任何项的项集是指
A、项
B、空集
C、超项集
D、子项集
8.从软件库中导入模糊C均值聚类算法类的语句是
A、from fcmeans import FCM
B、fcm=FCM(n_clusters=3)
C、fcm.fit(X)
D、fcm_labels=fcm.u.argmax(axis=1)
9.如果一个项集包含K个项,则该项集称为
A、项
B、空集
C、超项集
D、K项集
10.利用pandas处理数据缺失值时,用于丢弃重复值的函数为
A、drop_duplicates
B、duplicated
C、fillna
D、dropna
11.常用于多变量噪声值(异常值)处理的方法是
A、等深分箱
B、聚类法
C、等宽分箱
D、盖帽法
12.数据集{1,2,3,5,7,9}的中位数是
A、3
B、5
C、7
D、4
13.利用pandas处理数据缺失值时,用于发现缺失值的函数为
A、isnull
B、head
C、tail
D、info
14.关联规则 X→Y 表示中Y称为
A、前件
B、后件
C、中间件
D、以上都不对
15.数据集{1,2,2,2,3,4}的众数是
A、1
B、2
C、3
D、4
二、多选题(共5题,20分)
1.聚类分析可以用于
A、顾客分组
B、分类
C、回归
D、找出显著影响
2.关联规则反映的是
A、可分类性
B、可分割性
C、事物之间相互依存性
D、事物之间相互关联性
3.大数据收集的途径包括()
A、互联网
B、移动互联网
C、物联网传感器
D、手动
4.可用于实现数据one-hot编码的方法包括
A、Pandas的head
B、Pandas的get_dummies
C、sklearn.preprocessing.OneHotEncoder方法
D、Pandas的tail
5.决策树的关键点包括
A、采用Bagging框架
B、采用随机特征选择生成每个决策树的训练数据特征子集
C、采用采样数据集的特征子集训练对应决策树
D、以上都不对
三、判断题(共5题,20分)
1.定类数据层次比定序数据高
A、对
B、错
2.数据挖掘的过程都是有统一一致的步骤的
A、对
B、错
3.定序数据层次比定距数据高
A、对
B、错
4.下四分位数是指 数据从大到小排列排在第25%位置的数字,即最小的四分位数(下四分位数)
A、对
B、错
5.上世纪 70 年代,随着数据库管理系统趋于成熟,存储和查询百万兆字节甚至千万亿字节成为可能。而且,数据仓库允许用户从面向事物处理的思维方式向更注重数据分析的方式进行转变。因此,提取复杂深度系信息能力非常强啊
A、对
B、错
4.报表的数据源可以是( ) A.表或视图 B.表或查询 C.表、查询或视图 D.表或其他报表 答案:A 5.操作对象只能是一个表的关系运算是( ) A.联接和选择 B.联接和投影 C.选择和投影 D.自然连接和选择 答案:C 6.下列叙述中正确的是( ) A.为了建立一个关系,首先要构造数据的逻辑关系 B.表示关系的二维表中各元组的每一个分量还可以分成若干数据项 C.一个关系的属性名表称为关系模式 D.一个关系可以包括多个二维表 答案:A 7.在创建数据库表结构时,为该表中一些字段建立普通索引,其目的是( ) A.改变表中记录的物理顺序 B.为了对表进行实体完整性约束 C.加快数据库表的更新速度 D.加快数据库表的查询速度 答案:D 8.SQL语句中删除视图的命令是( ) A.DROP TABLE B.DROP VIEW C.ERASE TABLE D.ERASE VIEW 答案:B 9.设有两个数据库表,父表和子表之间是一对多的联系,为控制子表和父表的关联,可以设置“参照完整性规则”,为此要求这两个表( ) A.在父表连接字段上建立普通索引,在子表连接字段上建立主索引 B.在父表连接字段上建立主索引,在子表连接字段上建立普通索引 C.在父表连接字段上不需要建立任何索引,在子表连接字段上建立普通索引 D.在父表和子表的连接字段上都要建立主索引 答案:B 10.以下所列各项属于命令按钮事件的是( ) A.Parent B.This C.ThisForm D.Click 答案:D 11.在Visual FoxPro 中以下叙述正确的是( ) A.利用视图可以修改数据 B.利用查询可以修改数据 C.查询和视图具有相同的作用 D.视图可以定义输出去向 答案:A .现代企业制度的核心是()。 A.产权清晰 B.责任明确 C.政企分开 D.管理科学 答案:A 2.()指对企业的微观构造及其相关制度安排所作出的一系列界定、规制与约束的总和,具体表现为企业组织、运营、管理等一系列行为的规范化和制度化。 A.企业制度 B.企业战略 C.企业使命 D.企业远景 答案:A 3.1961年12月,美国著名管理学教授()发表了《管理理论的丛林》一文,对现代管理理论中的各种学派加以了分类和详细说明。 A.享利·普尔 B.麦卡勒姆 C.泰罗 D.哈罗德?孔茨 答案:D 4.被誉为“科学管理之父”的管理学家是 ( ) A.欧文 B.韦伯 C.法约尔 D.泰罗 答案:D 5.系统最基本的特征是()。 A.集合性 B.层次性 C.相关性 D.动态性 答案:A 6.一般认为管理科学是从美国管理学家( )开始出现的。 A.享利·普尔 B.麦卡勒姆 C.泰罗 D.法约尔 答案:C 7.民主管理是一种以( )为中心的管理。 A.事 B.效率 C.民主权利 D.人 答案:D 8.泰罗在管理方面的主要著作是 ( )。 A.《工业管理与一般管理》 B.《科学管理原理》 C.《管理学一般原理》 D.《组织》 答案:B 9.()是由上级主管部门下达的起导向作用的计划。 A.指导性计划 B.指令性计划 C.短期计划 D.长期计划 答案:A 二、多选题 (共 13 道试题,共 26 分) 10.企业决策的类型按决策的重要性分包括()。 A.长期决策 B.战略决策 C.战术决策 D.业务决策 答案:BCD 11.企业文化的功能包括()。 A.导向功能 B.凝聚功能 C.激励功能 D.约束功能 答案:ABCD 12.计划作为一种管理功能,具有如下特点() A.计划具有目的性 B.计划具有普遍性 C.计划具有适应性 D.计划具有经济性 答案:ABCD 12.设有表示学生选课的三张表,学生S(学号,姓名,性别,年龄,身份证号),课程C(课号,课名),选课SC(学号,课号,成绩),则表SC的关键字(键或码)为( ) A.课号,成绩 B.学号,成绩 C.学号,课号 D.学号,姓名,成绩 答案:C 13.MODIFY STRUCTURE命令的功能是( ) A.修改记录值 B.修改表结构 C.修改数据库结构 D.修改数据库或表结构 答案:B 14.在超市营业过程中,每个时段要安排一个班组上岗值班,每个收款口要配备两名收款员配合工作,共同使用一套收款设备为顾客服务,在超市数据库中,实体之间属于一对一关系的是( ) A.“顾客”与“收款口”的关系 B.“收款口”与“收款员”的关系 C.“班组”与“收款口”的关系 D.“收款口”与“设备”的关系 答案:D 15.下面关于类、对象、属性和方法的叙述中,错误的是( ) A.类是对一类相似对象的描述,这些对象具有相同种类的属性和方法 B.属性用于描述对象的状态,方法用于表示对象的行为 C.基于同一个类产生的两个对象可以分别设置自己的属性值 D.通过执行不同对象的同名方法,其结果必然是相同的 答案:D 16.在查询设计器环境中,“查询”菜单下的“查询去向”命令指定了查询结果的输出去向,输出去向不包括( ) A.临时表 B.表 C.文本文件 D.屏幕 答案:C 17.以下关于“查询”的描述正确的是( ) A.查询保存在项目文件中 B.查询保存在数据库文件中 C.查询保存在表文件中 D.查询保存在查询文件中 答案:D郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。