数据分析项目:从理论到实践
在上一篇博文中,我描述了确保数据分析项目取得成功的初始重要步骤:
首先,想法提供者(部门)和数据科学家之间的密切合作是实现既定项目目标的绝对必要条件。其次,在数据科学家上手之前,需要验证数据的质量和数量。
在这篇文章中,我想向您提供一些建议:数据分析项目在实践中是如何运作的?博世预测模型如何应用于用例?
1.数据分析项目的目标是否实现了?
资料来源:Bosch.IO
有时甚至在项目结束时,您可能会意识到该项目没有达到或完全没有达到目标。当您努力实现既定的项目目标时,需要考虑许多要点。在这里找到一些典型的错误:
一个。预测模型不准确
在项目结束时,您可能会意识到结果(例如预测模型)未能满足所需的准确性或无法提供预期的新见解。
为什么会这样?
您需要问的第一个问题是是否在项目开始时定义了模型所需的精度。当然,这是一个基本的先决条件,应该从项目规划阶段就考虑到。前面提到的与数据质量和数量相关的方面也可能导致结果不准确,因为数据“不会产生更多信息”。
因此,很明显,项目实施不应该归咎于项目结果不尽人意,而是计划阶段存在的陷阱对结果有重大影响。
b.长期追求不可持续的用例
通常,在项目开始时,所有利益相关者都欣喜若狂。技术和商业目标听起来很有希望。 “项目必须成功!”
然而,这句话隐藏了一个风险。尽管欣喜若狂,重要的是要对(中间)结果保持一定的中立性和怀疑态度。顽固地追求不可持续的用例可能意味着您最终会在一个项目上投入大量时间和金钱,却没有达到预期的结果。
因此,对于实现项目目标的可行性,以批判和开放的心态分析中间结果至关重要。
我们强烈建议您注意警告信号,不要仅仅因为您“必须”达到目标而追求实际上无法实现的项目目标!
让我在这里提一下“快速失败”或“改变它”的口头禅,它表明,与追求它并投入不必要的资源相比,快速识别或适应一个无法实现的目标要更好——不增加价值或实现有用的结果。>
我们分几个阶段提供支持。在每个阶段之后,它会分析到该点所取得的结果。这使得可以在流程的各个点调整项目目标或基础数据 - 使风险透明和可避免。
资料来源:Bosch.IO2.理论与实践——从概念验证 (PoC) 到操作用例
并非所有在“实验室条件”下工作的东西在实践中都证明是有效的。不幸的是,这是我们有时必须在项目结束时得出的结论。但首先我们必须对其进行测试。
开发的预测模型在历史训练数据的基础上,已经符合要求。现在是时候将其集成到操作环境中了。
即使在这个早期阶段,幻灭也可能会出现。预测模型旨在在控制系统上运行并实时(在毫秒范围内)进行预测。然而,这个要求在模型开发时是未知的。算法复杂,精度要求高,但资源有限,无法应用于目标硬件。
因此,最初看起来很棒的项目结果最终无法集成到实际用例中。原因再次是规划阶段的不足。
我们按照 CRISP-DM 标准开展数据分析项目——还有一个重要的补充:我们特别强调对客户的问题实现专家级的理解。 (另请参阅博客文章的问题 3:如何在制造业中启动数据分析项目。)
为此,在初始洞察阶段,我们的数据分析工程师会更多地了解客户的生产流程和要解决的具体问题。他们还提出了很多问题,使他们能够深入了解。这个阶段对于项目的成功极其重要,因为它为建立实际流程、问题和数据之间的相关性奠定了基础。不了解现实世界的过程和问题,就无法在数字世界中找到解决方案。
资料来源:Bosch.IO 资料来源:Bosch.IO
数据分析项目成功的最佳实践
数据分析项目失败的原因有很多。通常没有一个 原因单独;相反,问题在于各个方面的总和。
将必要的时间和注意力投入到数据分析项目的准备阶段和规划中。如果您遵守并遵循主要规则和最佳实践,您的项目就会走上成功之路。
工业技术