数据科学家的空缺以及各公司努力填补这一空白的持续投入在数据科学界并不算什么新闻。然而,拥有计算机科学技能、统计知识和与其特定业务问题相关的领域专业知识的数据科学家却不多见。
一方面,开发分析模型需要依仗领域的专业知识和实践经验进行决断;另一方面,视具体问题而定,进行数据分析可能需要具备传统的分析技术(如统计和优化)、数据特定的技术(如信号处理和图像处理)或更新的功能(如机器学习算法)。
事实上,通过在设计过程中使用统计方法和计算技术工具,工程师也可以变成数据科学家。
以一个机器学习的实际案例来说:
一家大型半导体制造公司的工艺工程师正在考虑采用新方法来确保晶圆各层对准,他们发现机器学习或可作为预测层间叠加的方法使用。但作为工艺工程师,他们没有使用这种新技术的经验。
通过在 MATLAB 中运行不同的机器学习示例,他们能够识别合适的机器学习算法,对历史数据进行训练,并将其集成到原型叠加控制器中。灵活的 MATLAB 环境允许这些工艺工程师应用他们的领域专业知识来构建数据模型,从而识别可能未被发现的系统和随机错误。
可见,为具备领域知识的工程师提供灵活且可扩展的软件工具,可以帮助工程师快速掌握机器学习新技术并解决数据问题。
随着技术的不断发展,企业必须快速摄取、分析、验证和可视化海量数据,以便及时提供洞察力,从而抓住商机。如此,领域专家能够运用并应用数据科学对业务有明显的好处,但这不可能一蹴而就。
由此带来的数据分析挑战还可能影响数据分析的价值。这些挑战包括:
1. 陡峭的新技术学习曲线
数据分析领域的创新步伐非常快,每项新技术都有自己的学习曲线。特别是对于那些并非专职从事代码编写的人来说,学习曲线将更加陡峭。
解决方案:
提供快速启动和运行的工具,最好是领域专家熟悉的计算平台中。
像 MATLAB 中的应用程序一样的点击式应用程序可以作为这些工程师的一个简单起点。除此之外,通常还需要编程接口来微调分析以提高稳健性和准确性。企业也应该寻找可以帮助工程师的培训课程,效果自然远胜通过试验和犯错来学习。
2. 工程师与数据科学家的团队配合
数据科学家通常在机器学习方面具有很强的背景,却不熟悉业务及其产品的细节。工程和科学团队了解业务及其产品,但可能没有机器学习经验。
解决方案:
提供灵活可扩展的工具。
针对领域专家降低机器学习标准的同时,为数据科学家提供灵活性和可扩展性。实际上,这意味着采用既具有图形界面(即应用程序)又具有编程语言的工具。为团队打造一个可以协作的环境至关重要。
3.数据分析在哪里结束
如果无法与企业的系统、产品和服务集成,成功开发的分析或机器学习模型对企业的价值便十分有限。传统上,分析是在适合研究和开发的工具中开发的,但不适合在生产中运行分析,因此必须在分析之前将分析重新编码为不同的编程语言。这一过程通常耗时数周到数月,并且可能会产生错误。
解决方案:
将算法打包以在不同生产环境中运行。
MATLAB 提供了用于将分析与 IT 系统中常用的编程语言(例如 Java和 .NET)集成的部署路径,以及将分析转换为可在嵌入式设备上运行的独立 C 代码。这两种部署选项都可通过点击式界面访问,使其对具备领域知识的工程师具有吸引力。通过将分析转换为在生产系统中运行的过程实现自动化,这些工具可显著缩短设计迭代的时间。
数据科学家短缺的问题似乎不会很快得到解决,而领域专家在填补这一空白方面将起到重要的作用。
使领域专家能够将机器学习和其他数据分析技术应用于他们的工作,这些技术为工程团队提供了令人兴奋的创新机会——包括他们的设计工作流程和他们打造的产品。他们对业务及其产品的了解使他们能够找到应用数据分析技术的创新方法。
-
数据
+关注
关注
8文章
7349浏览量
95025 -
机器学习
+关注
关注
67文章
8565浏览量
137226
发布评论请先 登录
跳线架在数据中心的应用与优化策略
TLE8262 - 2E通用系统基础芯片HERMES数据手册解读
如何将Primus生成的波形文件导入MATLAB
电能质量在线监测装置的监测数据如何存储和分析?
经营数据分析可以通过哪些方式
工业智能制造中,如何精准测量复杂曲面?
了解SOLIDWORKS202仿真方面的改进
MATLAB在数据方面的应用分析解读
评论