自动化数据科学和机器学习以获得业务洞察
数据科学家对于数据科学项目的成功至关重要。但是,他们不能单独做到这一点。他们需要其他技能组合以及自动化解决方案的帮助。
数据,石油 润滑现代机器的齿轮。但是,有一个问题。组织正在努力从这种新的力量中获得业务洞察力。
供不应求
在市场上,许多企业客户正在尝试建立非常大的数据科学团队。有些人正试图雇佣数百人来应对数据爆炸;从客户输入到物联网设备,这将成为主要渠道。
但这并不容易,数据科学家非常短缺。
正如 Gartner 所说,有公民数据科学家——创建或生成使用高级诊断分析或预测和规范能力的模型的人,但其主要工作职能在统计和分析领域之外——但他们为专家数据科学家。他们不会取代专家,因为他们不具备这样做的具体、先进的数据科学专业知识。
即便如此,很多企业都在努力建立一个公民数据科学团队,更不用说数据科学家团队了。
数据科学
数据科学被描述为一个多学科领域,它使用科学的方法、过程、算法和系统从各种形式的数据中提取知识和见解,包括结构化和非结构化,类似于数据挖掘。
自然,它有许多不同的组成部分。 dotData 首席执行官兼创始人 Ryohei Fujimaki 表示,其中之一是机器学习,这是“数据科学中最有趣的部分”。
企业面临的真正痛苦是在数据方面——构建数据集,以便它们能够成熟地应用数据科学。数据非常复杂,在企业中收集时不是 存储用于机器学习和数据科学目的。它是出于商业目的而存储的;例如在图表中。
企业必须将这些业务数据转换为机器学习格式,这被称为“特征学习”,Fujimaki 说。 “而且基本上我们必须应用大量领域知识来运行数据。”
因此,在这种人才短缺但数据不断流动的环境下,有必要将数据科学的端到端流程自动化;包括特征管道中的数据。
获得洞察并推动行动
机器学习可以预测、预测和识别新客户,例如在金融服务中,谁风险最大。这一预测*推动了业务流程自动化。核心业务与业务系统集成,自动触发一些业务动作。通过这种方式,有很多方面可以提高企业的效率。
机器学习和数据科学过程的另一个非常重要的成果是业务洞察力。数据非常复杂——行业专家拥有领域知识和直觉——但在进入企业的大量数据背后隐藏着许多隐藏的知识。机器学习或数据科学过程通常可以发现未知、看不见或意想不到的东西,即使对于专家来说也是如此。
dotData 示例
dotData 与一家银行客户合作,该客户应用其平台来预测谁是对抵押贷款类型产品感兴趣的新客户。他们首先认为这款产品会吸引年轻人。但是,他们发现,对它感兴趣的客户类型非常不同,年龄稍大一些的人。事实证明,这一人群购买该产品的人数超过了预测的年轻人群。
这种类型的新业务洞察力意味着客户可以针对该客户群构建和设计新的促销活动;或者他们可以根据这种业务洞察力设计新产品。
自动化数据科学和机器学习过程从数据中产生了新的业务洞察力。
仅靠数据科学家……还不够好
企业需要什么样的技能组合才能让数据科学提取有意义的业务成果?首先是数学或统计知识,但同时这些企业必须下载非常庞大、大规模、复杂的数据——他们需要为此进行数据工程。
“此外,使用相同的数据解决不同的业务问题,需要不同的领域专业知识,”Fujimaki 说。
优秀的数据科学家需要具备强大的数学和统计技能,但通常他们不具备业务和数据工程技能。
数据科学家的短缺是任何成功的数据科学项目的障碍。但是,问题是:仅靠数据科学家还不足以完成一个复杂的大型项目。
成功的数据科学项目需要领域专家、设计工程师和数据科学家。
数据科学项目的很大一部分是预测*——它需要与业务系统集成并自动驱动大量数字维护。这意味着企业需要一位了解此数据科学流程并将此数据科学流程适当地集成到业务系统中的工程师。藤卷称这类人为“数据科学人才”。
数据科学家是不可或缺的,但完成一个数据科学项目还需要更多角色。
dotData 等解决方案通过自动化数据科学和机器学习来帮助解决这个问题并分担工作并弥合差距。
自动化控制系统