北京语言大学23春《大数据技术与应用》作业1【标准答案】

内容摘要:
《大数据技术与应用》作业1
共25道题 总分:100分
一、单选题(共15题,60分)
1.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为
A、2
B、4
C、6
D
电大形考任务,国家开放大学作业答案,广东开放大学作业答案,电大作业答案。

作业 考核 论文 答案 一请联系 微--xhmcz122 Q-210969415

《大数据技术与应用》作业1

共25道题 总分:100分

一、单选题(共15题,60分)

1.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为

A、2

B、4

C、6

D、8

2.在pandas中脏数据的典型表示有()

A、np.nan

B、*

C、?

D、no

3.利用pandas处理数据缺失值时,用于丢弃缺失值的函数为

A、isnull

B、head

C、tail

D、dropna

4.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22}的中四分位数为

A、2

B、4

C、6

D、8

5.数据集{1,2,3,5,7,8,9}的中位数是

A、3

B、5

C、7

D、4

6.用训练好的LOF实例对数据进行LOF分数计算并排序的语句是

A、from sklean.neighbors import LocalOutlierFactor

B、clf=LocalOutlierFactor(n_neighbors=20)

C、y_pred=clf.fit_predict(X)

D、X_scores = clf.negative_outlier_factor_

7.利用pandas处理数据缺失值时,用于发现重复值的函数为

A、isnull

B、duplicated

C、fillna

D、dropna

8.分类的目标是

A、将一组对象分组以发现它们之间是否存在某种关系

B、从一组预定义的类中查找新对象所属的类

C、提高数据标签利用效率

D、以上都不对

9.项集 S ={ },则项集S称为

A、1项集

B、2项集

C、3项集

D、空集

10.训练随机森林模型实例的语句是
北语答案请进:

A、from sklearn.tree import DecisionTreetClassifier

B、clf=DecisionTreetClassifier()

C、clf.fit(Xtrain,Ytrain)

D、predictions=clf.predict(Xtest)

11.:from sklearn.tree import DecisionTreeClassifiernclf = DecisionTreeClassifier()nclf.fit(Xtrain,Ytrain) npredictions = clf.predict(Xtest)n上面代码第4行中Xtest表示

A、训练数据集

B、测试数据集

C、训练数据的类别标签数组

D、测试数据的类别标签数组

12.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的上四分位数为

A、20

B、22

C、20.5

D、28

13.关联规则 X→Y 表示中Y称为

A、前件

B、后件

C、中间件

D、以上都不对

14.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的四分位差为

A、20

B、22

C、20.5

D、18.5

15.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句

A、from sklean.neighbors import LocalOutlierFactor

B、clf=LocalOutlierFactor(n_neighbors=20)

C、y_pred=clf.fit_predict(X)

D、X_scores = clf.negative_outlier_factor_

二、多选题(共5题,20分)

1.常用的描述统计分析方法包括

A、对比分析法

B、平均分析法

C、交叉分析法

D、以上都不对

2.关联规则反映的是

A、可分类性

B、可分割性

C、事物之间相互依存性

D、事物之间相互关联性

3.数据集中趋势分析的常用指标包括

A、平均值

B、中位数

C、众数

D、四分位数

4.数据挖掘是适应信息社会从海量数据中提取信息的需要而产生的新学科,也是交叉学科,包括

A、统计学

B、机器学习

C、数据库

D、模式识别

5.常用的分类方法包括

A、朴素贝叶斯分类器

B、决策树

C、KNN

D、以上都不对

三、判断题(共5题,20分)

1.分箱法是针对连续的数值型数据中噪声进行处理

A、对

B、错

2.因为 Bayes 理论能够帮助理解基于概率估计的复杂现况,所以它成为了数据挖掘和概率论的基础

A、对

B、错

3.数据类型等级最高的是定类数据

A、对

B、错

4.分类算法的目的是找到数据的最优拟合

A、对

B、错

5.数据类型等级最低的是定比数据

A、对

B、错

《大数据技术与应用》作业1

共25道题 总分:100分

一、单选题(共15题,60分)

1.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为

A、2

B、4

C、6

D、8

2.在pandas中脏数据的典型表示有()

A、np.nan

B、*

C、?

D、no

3.利用pandas处理数据缺失值时,用于丢弃缺失值的函数为

A、isnull

B、head

C、tail

D、dropna

4.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22}的中四分位数为

A、2

B、4

C、6

D、8

5.数据集{1,2,3,5,7,8,9}的中位数是

A、3

B、5

C、7

D、4

6.用训练好的LOF实例对数据进行LOF分数计算并排序的语句是

A、from sklean.neighbors import LocalOutlierFactor

B、clf=LocalOutlierFactor(n_neighbors=20)

C、y_pred=clf.fit_predict(X)

D、X_scores = clf.negative_outlier_factor_

7.利用pandas处理数据缺失值时,用于发现重复值的函数为

A、isnull

B、duplicated

C、fillna

D、dropna

8.分类的目标是

A、将一组对象分组以发现它们之间是否存在某种关系

B、从一组预定义的类中查找新对象所属的类

C、提高数据标签利用效率

D、以上都不对

9.项集 S ={ },则项集S称为

A、1项集

B、2项集

C、3项集

D、空集

10.训练随机森林模型实例的语句是

A、from sklearn.tree import DecisionTreetClassifier

B、clf=DecisionTreetClassifier()

C、clf.fit(Xtrain,Ytrain)

D、predictions=clf.predict(Xtest)

11.:from sklearn.tree import DecisionTreeClassifiernclf = DecisionTreeClassifier()nclf.fit(Xtrain,Ytrain) npredictions = clf.predict(Xtest)n上面代码第4行中Xtest表示

A、训练数据集

B、测试数据集

C、训练数据的类别标签数组

D、测试数据的类别标签数组

12.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的上四分位数为

A、20

B、22

C、20.5

D、28

13.关联规则 X→Y 表示中Y称为

A、前件

B、后件

C、中间件

D、以上都不对

14.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的四分位差为

A、20

B、22

C、20.5

D、18.5

15.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句

A、from sklean.neighbors import LocalOutlierFactor

B、clf=LocalOutlierFactor(n_neighbors=20)

C、y_pred=clf.fit_predict(X)

D、X_scores = clf.negative_outlier_factor_

二、多选题(共5题,20分)

1.常用的描述统计分析方法包括

A、对比分析法

B、平均分析法

C、交叉分析法

D、以上都不对

2.关联规则反映的是

A、可分类性

B、可分割性

C、事物之间相互依存性

D、事物之间相互关联性

3.数据集中趋势分析的常用指标包括

A、平均值

B、中位数

C、众数

D、四分位数

4.数据挖掘是适应信息社会从海量数据中提取信息的需要而产生的新学科,也是交叉学科,包括

A、统计学

B、机器学习

C、数据库

D、模式识别

5.常用的分类方法包括

A、朴素贝叶斯分类器

B、决策树

C、KNN

D、以上都不对

三、判断题(共5题,20分)

1.分箱法是针对连续的数值型数据中噪声进行处理

A、对

B、错

2.因为 Bayes 理论能够帮助理解基于概率估计的复杂现况,所以它成为了数据挖掘和概率论的基础

A、对

B、错

3.数据类型等级最高的是定类数据

A、对

B、错

4.分类算法的目的是找到数据的最优拟合

A、对

B、错

5.数据类型等级最低的是定比数据

A、对

B、错

《大数据技术与应用》作业1

共25道题 总分:100分

一、单选题(共15题,60分)

1.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为

A、2

B、4

C、6

D、8

2.在pandas中脏数据的典型表示有()

A、np.nan

B、*

C、?

D、no

3.利用pandas处理数据缺失值时,用于丢弃缺失值的函数为

A、isnull

B、head

C、tail

D、dropna

4.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22}的中四分位数为

A、2

B、4

C、6

D、8

5.数据集{1,2,3,5,7,8,9}的中位数是

A、3

B、5

C、7

D、4

6.用训练好的LOF实例对数据进行LOF分数计算并排序的语句是

A、from sklean.neighbors import LocalOutlierFactor

B、clf=LocalOutlierFactor(n_neighbors=20)

C、y_pred=clf.fit_predict(X)

D、X_scores = clf.negative_outlier_factor_

7.利用pandas处理数据缺失值时,用于发现重复值的函数为

A、isnull

B、duplicated

C、fillna

D、dropna

8.分类的目标是

A、将一组对象分组以发现它们之间是否存在某种关系

B、从一组预定义的类中查找新对象所属的类

C、提高数据标签利用效率

D、以上都不对

9.项集 S ={ },则项集S称为

A、1项集

B、2项集

C、3项集

D、空集

10.训练随机森林模型实例的语句是

A、from sklearn.tree import DecisionTreetClassifier

B、clf=DecisionTreetClassifier()

C、clf.fit(Xtrain,Ytrain)

D、predictions=clf.predict(Xtest)

11.:from sklearn.tree import DecisionTreeClassifiernclf = DecisionTreeClassifier()nclf.fit(Xtrain,Ytrain) npredictions = clf.predict(Xtest)n上面代码第4行中Xtest表示

A、训练数据集

B、测试数据集

C、训练数据的类别标签数组

D、测试数据的类别标签数组

12.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的上四分位数为

A、20

B、22

C、20.5

D、28

13.关联规则 X→Y 表示中Y称为

A、前件

B、后件

C、中间件

D、以上都不对

14.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的四分位差为

A、20

B、22

C、20.5

D、18.5

15.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句

A、from sklean.neighbors import LocalOutlierFactor

B、clf=LocalOutlierFactor(n_neighbors=20)

C、y_pred=clf.fit_predict(X)

D、X_scores = clf.negative_outlier_factor_

二、多选题(共5题,20分)

1.常用的描述统计分析方法包括

A、对比分析法

B、平均分析法

C、交叉分析法

D、以上都不对

2.关联规则反映的是

A、可分类性

B、可分割性

C、事物之间相互依存性

D、事物之间相互关联性

3.数据集中趋势分析的常用指标包括

A、平均值

B、中位数

C、众数

D、四分位数

4.数据挖掘是适应信息社会从海量数据中提取信息的需要而产生的新学科,也是交叉学科,包括

A、统计学

B、机器学习

C、数据库

D、模式识别

5.常用的分类方法包括

A、朴素贝叶斯分类器

B、决策树

C、KNN

D、以上都不对

三、判断题(共5题,20分)

1.分箱法是针对连续的数值型数据中噪声进行处理

A、对

B、错

2.因为 Bayes 理论能够帮助理解基于概率估计的复杂现况,所以它成为了数据挖掘和概率论的基础

A、对

B、错

3.数据类型等级最高的是定类数据

A、对

B、错

4.分类算法的目的是找到数据的最优拟合

A、对

B、错

5.数据类型等级最低的是定比数据

A、对

B、错

4.报表的数据源可以是( ) A.表或视图 B.表或查询 C.表、查询或视图 D.表或其他报表 答案:A 5.操作对象只能是一个表的关系运算是( ) A.联接和选择 B.联接和投影 C.选择和投影 D.自然连接和选择 答案:C 6.下列叙述中正确的是( ) A.为了建立一个关系,首先要构造数据的逻辑关系 B.表示关系的二维表中各元组的每一个分量还可以分成若干数据项 C.一个关系的属性名表称为关系模式 D.一个关系可以包括多个二维表 答案:A 7.在创建数据库表结构时,为该表中一些字段建立普通索引,其目的是( ) A.改变表中记录的物理顺序 B.为了对表进行实体完整性约束 C.加快数据库表的更新速度 D.加快数据库表的查询速度 答案:D 8.SQL语句中删除视图的命令是( ) A.DROP TABLE B.DROP VIEW C.ERASE TABLE D.ERASE VIEW 答案:B 9.设有两个数据库表,父表和子表之间是一对多的联系,为控制子表和父表的关联,可以设置“参照完整性规则”,为此要求这两个表( ) A.在父表连接字段上建立普通索引,在子表连接字段上建立主索引 B.在父表连接字段上建立主索引,在子表连接字段上建立普通索引 C.在父表连接字段上不需要建立任何索引,在子表连接字段上建立普通索引 D.在父表和子表的连接字段上都要建立主索引 答案:B 10.以下所列各项属于命令按钮事件的是( ) A.Parent B.This C.ThisForm D.Click 答案:D 11.在Visual FoxPro 中以下叙述正确的是( ) A.利用视图可以修改数据 B.利用查询可以修改数据 C.查询和视图具有相同的作用 D.视图可以定义输出去向 答案:A .现代企业制度的核心是()。 A.产权清晰 B.责任明确 C.政企分开 D.管理科学 答案:A 2.()指对企业的微观构造及其相关制度安排所作出的一系列界定、规制与约束的总和,具体表现为企业组织、运营、管理等一系列行为的规范化和制度化。 A.企业制度 B.企业战略 C.企业使命 D.企业远景 答案:A 3.1961年12月,美国著名管理学教授()发表了《管理理论的丛林》一文,对现代管理理论中的各种学派加以了分类和详细说明。 A.享利·普尔 B.麦卡勒姆 C.泰罗 D.哈罗德?孔茨 答案:D 4.被誉为“科学管理之父”的管理学家是 ( ) A.欧文 B.韦伯 C.法约尔 D.泰罗 答案:D 5.系统最基本的特征是()。 A.集合性 B.层次性 C.相关性 D.动态性 答案:A 6.一般认为管理科学是从美国管理学家( )开始出现的。 A.享利·普尔 B.麦卡勒姆 C.泰罗 D.法约尔 答案:C 7.民主管理是一种以( )为中心的管理。 A.事 B.效率 C.民主权利 D.人 答案:D 8.泰罗在管理方面的主要著作是 ( )。 A.《工业管理与一般管理》 B.《科学管理原理》 C.《管理学一般原理》 D.《组织》 答案:B 9.()是由上级主管部门下达的起导向作用的计划。 A.指导性计划 B.指令性计划 C.短期计划 D.长期计划 答案:A 二、多选题 (共 13 道试题,共 26 分) 10.企业决策的类型按决策的重要性分包括()。 A.长期决策 B.战略决策 C.战术决策 D.业务决策 答案:BCD 11.企业文化的功能包括()。 A.导向功能 B.凝聚功能 C.激励功能 D.约束功能 答案:ABCD 12.计划作为一种管理功能,具有如下特点() A.计划具有目的性 B.计划具有普遍性 C.计划具有适应性 D.计划具有经济性 答案:ABCD 12.设有表示学生选课的三张表,学生S(学号,姓名,性别,年龄,身份证号),课程C(课号,课名),选课SC(学号,课号,成绩),则表SC的关键字(键或码)为( ) A.课号,成绩 B.学号,成绩 C.学号,课号 D.学号,姓名,成绩 答案:C 13.MODIFY STRUCTURE命令的功能是( ) A.修改记录值 B.修改表结构 C.修改数据库结构 D.修改数据库或表结构 答案:B 14.在超市营业过程中,每个时段要安排一个班组上岗值班,每个收款口要配备两名收款员配合工作,共同使用一套收款设备为顾客服务,在超市数据库中,实体之间属于一对一关系的是( ) A.“顾客”与“收款口”的关系 B.“收款口”与“收款员”的关系 C.“班组”与“收款口”的关系 D.“收款口”与“设备”的关系 答案:D 15.下面关于类、对象、属性和方法的叙述中,错误的是( ) A.类是对一类相似对象的描述,这些对象具有相同种类的属性和方法 B.属性用于描述对象的状态,方法用于表示对象的行为 C.基于同一个类产生的两个对象可以分别设置自己的属性值 D.通过执行不同对象的同名方法,其结果必然是相同的 答案:D 16.在查询设计器环境中,“查询”菜单下的“查询去向”命令指定了查询结果的输出去向,输出去向不包括( ) A.临时表 B.表 C.文本文件 D.屏幕 答案:C 17.以下关于“查询”的描述正确的是( ) A.查询保存在项目文件中 B.查询保存在数据库文件中 C.查询保存在表文件中 D.查询保存在查询文件中 答案:D

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: