计算机光盘软件与应用

期刊导读

数据挖掘技术在线上教育平台中的应用

来源:计算机光盘软件与应用 【在线投稿】 栏目:期刊导读 时间:2021-03-28

在信息技术飞速发展的基础上,同时受今年新型冠状病毒疫情影响,线上教育商业发展趋势呈大规模增长,线上教育平台竞争激烈,各个线上教育平台都积累了以不同形式存储的海量数据资料。在大量的资料中,隐藏着许多有用信息,但这些信息很难有效被人们获得,仅依靠传统的数据检索或者统计学方法很难做到。想要利用好这些难得的大数据资源,就需要人们探索和开发更多方法技术,比如数据挖掘(Data Mining,DM)技术。

数据挖掘(Data Mining,DM)技术,通常又称为数据库中的知识发现(Knowledge Discovery in Databases),是从大量的、有噪声的、不完全的、模糊的、随机的实际应用数据中提取有效的、新颖的、潜在有用的知识的非平凡过程。它融合了数据库技术、人工智能、机器学习、统计学、知识工程、信息检索等最新的技术研究成果。数据挖掘技术在非常多的领域都可以用得到,只要是有分析价值的数据库,都可以利用数据挖掘工具为决策者获得有效信息提供帮助。

线上教育平台数据是有分析价值的大数据资源

首先,线上教育平台数据类型极其繁多,可分类为结构化数据、半结构化数据和非结构化数据,它们的组织形式、形态结构、类型格式呈多样化特征。

其次,除今年疫情影响外,云计算、移动线上、社交网络、移动设备APP的应用等也推进了线上教育平台流量的迅速增长。这些数据时效性强,要想有效其价值,必须及时处理和分析,而数据挖掘技术是最有效及时的方式之一。

几种数据挖掘的主要方法

利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等。在这里,本文主要介绍3种数据挖掘技术在线上教育平台的应用。

分类

分类是找出数据库中一组数据对象的共同特点,并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。其重要技术有:决策树、贝叶斯网络、神经网络、支持向量机、深度学习等。

分类在线上教育平台中可以应用到学生的分类,学生的属性和特征分析、学生的需求预测等。例如,将学生选择的课程按内容分类,根据学习者的背景、以往活动日志、学习路径等预测其新的学习需求,为学生推送符合需要的学习课程。

关联规则

关联规则是描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。在大数据背景下的教育教学资源中,关联性是其重要的特征之一。

在线上教育教学中,学生和教师会因为兴趣和需求建立实时或非实时的讨论小组,进行讨论及交流协作。同时在内容、主题等方面,教学资源也具有关联性。因此,在学习者之间、教学资源和学习者之间、教学资源之间产生了丰富的关联关系。通过关联分析,可以为学习者推送相关联的学习内容,设定相关联的主题,提供个性化学习服务。

聚类

聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。聚类可帮人们掌握事物内部规律。

数据挖掘在线上教育平台的应用

构建学习者特征模型。依据学习者不同的特征参数,根据学习者经常访问的URL,跟踪统计学生访问次数、总停留时间、访问课程数、网站某时间段访问次数、参与讨论情况、学习偏好等,对学生学习活动进行全面跟踪和记录,再通过数据挖掘的去噪和模式发现模块,得到学习者的学习特征风格,建立和完善学习者学习模型,建立学习者个性数据库,作为后期学习者学习策略的制定奠定基础。数据库建立后,可为学习者调整学习资源,过滤无关信息。还可利用统计分析技术,预测学习者行为。

以个性化学习指导为导向。学习者作为个体,在个人学习能力、兴趣及学习习惯、原有基础及努力程度上都有不同,且这些属性是持续变化的。数据挖掘可用来挖掘学习者使用数据日志,分析其浏览趋势,以预测未来的访问模式。将有利于解决线上教育中针对各层次学生因材施教的问题。以个性化学习指导为导向,就是动态地获取学习者当前学习过程信息,在学习界面上反馈挖掘处理后的信息,给学习者以适合的、个性化的学习指导。