
为了开阔同学们的专业视野,上海商业会计学校信息技术教学部邀请了上海交通大学的范磊教授于4月2日下午1点在1号楼401阶梯教室为同学们做一期关于“大数据应用”的讲座。出席参加本次讲座的有信息技术教学部陈文渊、王忠润老师,17级和18级各班级对大数据应用感兴趣的同学。
大数据,顾名思义就是巨量的数据,可能大到无法用大脑来计算,而且它的种类也十分多,在各行各业中都存在,应用也非常广泛。此前,阿里云已经与浙江省交通运输厅达成战略合作,共同推进智能高速公路建设。利用大数据的概念,使智能高速公路将全面支持普通功能车、互联网汽车、自动驾驶汽车,赋予驾驶者以“千里眼”和“顺风耳”。道路会告诉车辆“我看到了什么”,车俩个会告诉道路“我经历了什么”,数据则在云端运筹帷幄,人-车-路-云全面协同。即便是高速路上500米外的一个小坑,车辆也能提前“看到”。
这一构思就运用了大数据中的机器学习---就是让机器观察样品,然后得出规律,有新品种出现之后,知道如何区分。不过这一方法对一些类似双螺旋类型的数据是行不通的,这时候就要用到k近邻的算法---该方法的思路是:如果来了一个人,看他周围最近的一些人,这些人大多数是什么样的,由此来判断他是怎么样的一个人。
范磊教授还为我们举了一个网络爬虫的例子:从互联网上把程序代码嵌入浏览器。可以打开百度搜索入口的页面,拷贝想要的内容,爬虫会模拟人,再点进去将数据自动保存到磁盘中,这是最基本的获取数据的方法,对于更加复杂的我们可以使用Python来进行编程。
数据获取之后就是数据的预处理。就是对自然语言的处理,可分为“分词”,“做数据分析”,“模型分类”,“可视化”等用一些算法来使数据做成统一形式。
在讲座的结尾,同学们积极的向范教授提问,大家表达了对于屏下指纹的浓厚研究兴趣,范雷教授针对提问对光学指纹和超声波指纹的区别做了详细的解答:两者都是屏下指纹,差距就在,光学指纹就像复印机,识别时屏幕会达到最高亮度,在扫描按压指纹时会计算指纹数据,再进行分析比对,优点是造价便宜,识别速度快;缺点在于屏幕有污渍或者手有污渍有水的时候,识别率不准确,在强光下识别率也不高,容易被复制,还需要特制屏幕。2D面部识别和光学指纹差不多,是在平面内进行分析对比。超声波指纹和3D面部识别差不多,在扫描指纹时会进行3D指纹建模,并进行分析、整理、计算,再和之前录入指纹进行对比,优点是不容易复制,识别率高,即使屏幕有污渍,手上有水和污渍,也不影响识别的准确率;缺点是造价高。和3D面部识别不同的是,超声波指纹最终会以3D模型的样子呈现,而3D面部识别会以平面形式呈现。无论是面部识别还是屏下指纹都是六七十年前各种大数据分析得出的经验和结果,才有了今天先进的科技,和解锁方式。
这次的讲座给信息技术教学部的学生上了关于大数据生动的一课。从大数据的基本概念到如何使用爬虫软件在互联网上搜索自己所需要的数据,范磊教授为在场师生一一讲述了这些我们之前闻所未闻的知识点。平时看似浅显易懂的问题背后都是经过了科学家千锤百炼的推敲才得以解开。我们每天接触的数据正在以指数性的速度增长。这次讲座让所有人都觉得受益匪浅。
【撰稿 信息技术教学部 李想】