什么是好的数据科学家

如题所述

一、一个数据科学家应该具有如下五个特质与技能:

     定量分析技能——例如数学和统计技能

    技术才能——例如软件工程、机器学习和编程能力

    善于怀疑——每个数据科学家必须善于用批判的眼光来审视自己的工作,而不是采用片面的求同方式。如果坚信自己或者别人是对的,一定要有全面的客观依据来支持。反之亦然。

    好奇与创新——数据科学家必须对数据充满激情,并找到创新的方式来解决问题和描述信息。例如对于不同的客户群,要能够运用灵活的、创新的方法,正确的为客户提出最适合的解决方案。

    沟通与合作——即使具有很强的定量和工程技能也是不够的。一个数据科学项目的成败取决于团队协作。数据科学家不是关在一个屋子里独自工作的。即便大部分数据科学家都是内向的,但是他们会走出自己的圈子,与客户、项目发起人、项目干系人、其它项目相关同僚合作,并能够采用清晰的方式表达出项目中的商业价值。

二、除去上述5个特点之外,数据科学家还会非常熟练的运用下列技能:

    数据获取——熟练编写代码以从传统和非传统的数据源获取数据(例如:编写代码从微博抓取并清理非结构化数据。)

    数据管理——提取、转换、加载(ETL)、查询、维护从数据库、key-value存储(例如CouchDB和MongoDB),和Hadoop里的数据

    数据可视化——运用静态的数据可视化工具或是交互性的数据可视化平台(例如R、Python、D3.js、Tableau、Processing和Gephi)以发现并确认数据的模式

    数据分析——灵活运用多领域的简单和复杂的技术。这些领域包括数学统计、机器学习、数据挖掘、自然语言处理等等。

    故事讲述——用讲述故事的方式形象地为各种背景的听众展示总结的关键发现。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2016-09-02
信息化是将现实世界中的事物和现象以数据的形式存储到CYBER空间中,是一个生产数据的过程。这些数据是自然和生命的一种表示形式,这些数据还记录了人类的行为,包括工作、生活和社会发展。今天,数据被快速大量地生产并存储在CYBER空间中,这种现象称为数据爆炸(data explosion),数据爆炸在CYBER空间中形成数据自然界(data nature )。数据是CYBER空间中的唯一存在,需要研究和探索CYBER空间中数据的规律和现象。另外,探索CYBER空间中数据的规律和现象,就是探索宇宙的规律、探索生命的规律、寻找人类行为的规律、寻找社会发展的规律的一种重要手段,例如:可以通过研究数据来研究生命(生物信息学)、研究人类行为(行为信息学)。数据学(Dataology)和数据科学(Data Science)(以下称数据学)是关于数据的科学或者研究数据的科学,定义为:研究探索Cyberspace中数据界(datanature)奥秘的理论、方法和技术,研究的对象是数据界中的数据。与自然科学和社会科学不同,数据学和数据科学的研究对象是Cyberspace的数据,是新的科学。数据学和数据科学主要有两个内涵:一个是研究数据本身,研究数据的各种类型、状态、属性及变化形式和变化规律;另一个是为自然科学和社会科学研究提供一种新的方法,称为科学研究的数据方法,其目的在于揭示自然界和人类行为现象和规律。数据学已经有一些方法和技术,例如:数据获取 、数据存储与管理 、数据安全 、数据分析、可视化等;还需要有基础理论和新技术,例如:数据存在性、数据测度、时间、数据代数、数据相似性与簇论、数据分类与数据百科全书、数据伪装与识别、数据实验、数据感知等等。数据学的理论和方法将改进现有的科学研究方法,形成新型的科学研究方法,并且针对各个研究领域开发出专门的理论、技术和方法,从而形成专门领域的数据学,例如:行为数据学、生命数据学、脑数据学、气象数据学、金融数据学、地理数据学,等等。本回答被网友采纳
相似回答