什么是“大数据”,如何理解“大数据”

如题所述

你好,大数据是指巨量的数据,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。

当下,大数据技术作为新兴技术被许多互联网大厂所需,以华为为例。

1、华为云推出大数据稽核方案解决偷逃费

很多朋友可能发现,部分省界收费站变少而ETC通道在增加,高速公路的出行体验比以前更加顺畅。然而,在公众体验节省费用、便捷通行等利好的同时,高速公路的管理运营单位却饱受新情况的困扰。

部分车主偷逃费方式多样化,包括换卡逃费、车头挂车分离逃费、倒换电子标签、ETC车道跟车逃费等。同时偷逃费行为向专业化、团伙化演变,给高速运营单位带来大量经济损失和严峻挑战。

目前收费卡口仍主要使用传统稽核方法。传统方式通常基于初步的车辆行驶异常信息作筛查依据,如频繁进出站等,却难以发现大量逃费,存在的主要问题是:

大数据分析应用较少,缺乏数据深度分析

基本以收费数据为主,视频/图片等辅助证据不足

依赖大量人工进行稽核,效率低下

针对传统稽核方法的不足之处,华为云正式推出高速公路大数据稽核解决方案。

该方案基于华为云业界领先的云数字平台,结合华为在高速公路行业的深厚积淀,利用大数据、人工智能、云计算等技术,实现了海量通行记录数据的偷逃费自动分析,并结合门架摄像头抓拍的图像记录实现偷逃费车辆的精准识别,保障高速业主收益。

华为云大数据稽核解决方案包括三大平台:

AI边缘稽核平台,基于华为自研鲲鹏920和升腾310芯片+智能边缘平台IEF Edge架构,实现30+车辆特征和上万种车型的识别、稽核场景的实时处理,车辆通行照片的存储;

大数据稽核平台,主要包括基础设施层、平台层、使能层、应用层:

基础设施层:提供计算、存储、网络等基础资源

平台层:提供智能数据湖平台DAYU、AI开发平台ModelArts、边缘管理平台IEF、数据库及中间件等通用平台及组件

使能层:提供车辆识别算法、以图搜图、路径还原等基础能力

应用层:包括稽核系统、客服系统等其他公共服务类系统,其中稽核系统主要实现偷逃费模型、通行记录分析、证据链管理、信用管理、黑白名单管理等稽核相关功能

车辆特征训练开发平台,实现新的车型识别和车辆特征识别能力的持续提升,车辆异常通行照片的持久存储;其中ModelArts是一站式AI训练开发平台,提供车型和车辆特征的海量数据预处理及半自动化标注、大规模分布式训练、车辆识别模型自动化生成、云边按需部署模型等能力。

2、华为大数据工程师

华为云致力于为客户提供高度可信的业务运行环境,易获取、按需使用、弹性扩展的云安全服务,帮助客户保护云上的应用系统和重要数据,华为云已获得了CSA STAR、ISO安全体系等20多个安全合规认证,并在2018年就高分通过了等保四级测评。

目前,包括腾讯、阿里等互联网头部企业在内的大厂,均在积极使用大数据、云计算等技术为产品赋能。

例如最早使用大数据技术实现音乐推荐个性化的网易云音乐、在电商平台普遍使用的商品推荐功能等等,均是基于大数据技术运用的代表。

以华为为例,华为给1-3年经验的大数据开发工程师开到了高达4万的月薪,在其他大厂的招聘中30k-60k的大数据开发工程师,也只要1-3年工作经验,可以说大数据、云计算仍是当下的红利岗位。


希望我的回答对你有所帮助!

温馨提示:答案为网友推荐,仅供参考
第1个回答  2018-02-04

    大数据的定义。大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

    大数据的特点。数据量大、数据种类多、 要求实时性强、数据所蕴藏的价值大。在各行各业均存在大数据,但是众多的信息和咨询是纷繁复杂的,我们需要搜索、处理、分析、归纳、总结其深层次的规律。

    大数据的采集。科学技术及互联网的发展,推动着大数据时代的来临,各行各业每天都在产生数量巨大的数据碎片,数据计量单位已从从Byte、KB、MB、GB、TB发展到PB、EB、ZB、YB甚至BB、NB、DB来衡量。大数据时代数据的采集也不再是技术问题,只是面对如此众多的数据,我们怎样才能找到其内在规律。

    大数据的挖掘和处理。大数据必然无法用人脑来推算、估测,或者用单台的计算机进行处理,必须采用分布式计算架构,依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术,因此,大数据的挖掘和处理必须用到云技术。

    大数据的应用。大数据可应用于各行各业,将人们收集到的庞大数据进行分析整理,实现资讯的有效利用。举个本专业的例子,比如在奶牛基因层面寻找与产奶量相关的主效基因,我们可以首先对奶牛全基因组进行扫描,尽管我们获得了所有表型信息和基因信息,但是由于数据量庞大,这就需要采用大数据技术,进行分析比对,挖掘主效基因。例子还有很多。

    大数据的意义和前景。总的来说,大数据是对大量、动态、能持续的数据,通过运用新系统、新工具、新模型的挖掘,从而获得具有洞察力和新价值的东西。以前,面对庞大的数据,我们可能会一叶障目、可见一斑,因此不能了解到事物的真正本质,从而在科学工作中得到错误的推断,而大数据时代的来临,一切真相将会展现在我么面前。

本回答被网友采纳
第2个回答  2020-10-09

大数据是什么?在很多人的眼里大数据可能是一个很模糊的概念,
但是,在日常生活中大数据有离我们很近,我们无时无刻不再享受着大数据所给我们带来的便利,个性化,人性化。
全面的了解大数据我们应该从四个方面简单了解。
定义,结构特点,
我们身边有哪些大数据,大数据带来了什么,
这四个方面了解。

那么“大数据”到底是什么呢?

在麦肯锡全球研究所给出的定义中指出:大数据即是一种规模大到在获取,存储,管理,分析方面大大超出了传统数据库软件工具能力范围的数据集合。简单而言大数据是数据多到爆表。大数据的单位一般以PB衡量。那么PB是多大呢?1GB=1024MB,1PB=1024GB才足以称为大数据。
其次,大数据具有什么样的特点和结构呢?

大数据从整体上看分为四个特点,第一,大量。

衡量单位PB级别,存储内容多。

第二,高速。
大数据需要在获取速度和分析速度上要及时迅速。保证在短时间内更多的人接收到信息。

第二,多样。

数据的来源是各种渠道上获取的,有文本数据,图片数据,视频数据等。因此数据是多种多样的。

第三,价值。

大数据不仅仅拥有本身的信息价值,还拥有商业价值。
大数据在结构上还分为:结构化,半结构化,非结构化。结构化简单来讲是数据库,是由二维表来逻辑表达和实现的数据。非结构化即数据结构不规则或不完整,没有预定义的数据模型。由人类产生的数据大部分是非结构化数据。

那我们身边有哪些东西是大数据呢?

在生产生活中常见的有电信数据:通话数据、短信数据、手机浏览数据。银行数据,微信聊天数据等。

14_spark体系之分布式计算课程Spark 集群搭建+S

第3个回答  2020-04-14

数字时代,互联网运营离不开大数据,什么是大数据?怎么应用呢?

第4个回答  2019-09-22
相似回答