Arijit Laha 博士: 。
数据科学行业准备情况
各行各业是否希望了解如何利用数据?他们是否拥有所需的数据?
Arijit Laha 博士: 业界已经意识到了这一潜力,并希望进一步了解。遗憾的是,许多企业在这方面采取了一些错误的流程。
从绝对数量来看,各行各业都拥有大量的运营和交易数据。但这些数据分散在各个数据库中。很少有全面且最新的数据清单,而这对于准备好进行分析的数据至关重要。
基于行业或基于技术领域,数据科学面临的三大问题是什么?
Arijit Laha 博士:
- 缺乏数据准备
- 业务问题表述缺乏严谨性和清晰度
- 缺乏足够熟练的数据科学家
对有志于成为数据科学家的人的建议
您认为数据分析师和数据科学家需要具备哪些最重要的技能,包括技术技能和软技能?
Arijit Laha 博士:
- 了解数据科学不仅仅是 手机号数据库列表 应用算法,而是为业务问题提供最佳解决方案。
- 如何将业务问题映射到技术领域。
- 与客户进行有益的讨论和沟通
有志于成为数据从业者的人应该在处理混乱、嘈杂的数据时投入多少精力?他们还必须在哪些领域积累专业知识?
Arijit Laha 博士: 现实生活中的数据总是混乱且嘈杂的。
您对新手、数据科学学生或希望在数据分析行业建立职业生涯的从业者有什么建议?
Arijit Laha 博士:
- 编程和软件技能——R、Python、SAS 或 Excel
- 需要掌握许多工具,但
- 需要掌握至少一种图灵完备的编程语言,并具备良好的分析库支持——Python 和 R 是很好的选择
- 可视化工具
- 有很多工具,我个人最喜欢的是 Tableau
- 但还必须掌握编程语 你无需刷卡就可以使用ATM取款 言特定的图形和可视化包/库
- 统计基础与应用知识
- 必须具备,包括线性代数
- 机器学习
- 显然,必须有, 首席执行官电子邮件列表 另外
- 不仅需要了解 ML 技术/算法可以做什么,还需要知道(记住)它在什么样的条件/情况下不能很好地工作。