主要内容
几年前,商业科技界最喜爱的流行词是“大数据”——指的是组织大量收集信息,可用于提出以前未探索过的运营方式,并提出关于他们可能最好追求的策略的想法。越来越明显的是,公司利用大数据获取优势所面临的问题仍然存在,而一种新技术——人工智能——正在使这些问题再次浮出水面。如果不解决困扰大数据的问题,人工智能的实施将继续失败。那么,阻碍人工智能兑现其承诺的问题是什么呢?绝大多数问题源于数据资源本身。为了理解这个问题,考虑在一个非常普通的工作日中使用的以下信息来源。在一家中小型企业中:存储在用户笔记本电脑、谷歌表格、Office 365 云中的电子表格。客户关系管理(CRM)平台。同事、客户、供应商之间的电子邮件交流。Word 文档、PDF、网络表单。即时通讯应用程序。在一家企业中:上述所有内容,加上企业资源规划(ERP)系统、实时数据馈送、数据湖、多个点产品背后的不同数据库。值得注意的是,上面简单的列表并不全面,也不是有意为之。它表明,仅在五行中,就有大约十几个可以找到信息的地方。大数据(也许仍然需要)以及人工智能项目所依赖的是,以某种方式将所有这些元素整合在一起,以便计算机算法能够理解它。营销巨头 Gartner 的 2024 年人工智能炒作周期将 AI 就绪数据置于炒作周期的上升曲线,估计需要 2 - 5 年才能达到“生产力平台”。鉴于人工智能系统挖掘和提取数据,大多数组织——除了那些规模非常大的组织——没有建立的基础,可能在未来 1 - 4 年都没有人工智能帮助。人工智能实施的根本问题与过去困扰大数据创新的问题相同——从创新触发、膨胀期望的峰值、幻灭的低谷、启蒙的斜坡到生产力的平台——数据有多种形式;它可能不一致;也许它遵循不同的标准;它可能不准确或有偏见;它可能是高度敏感的信息,或者是陈旧的,因此无关紧要。将数据转换为 AI 就绪状态仍然是一个与今天(也许更重要)相关的过程。那些希望抢先一步的公司可以尝试当前可用的许多数据处理平台,并像普遍的建议那样,可能从离散项目开始作为试验台来评估新兴技术的有效性。最新数据准备和组装系统的优势在于,它们旨在以设计用于 AI 价值创造平台使用数据的方式准备组织的信息资源。例如,它们可以提供精心编码的护栏,帮助确保数据合规性,并保护用户免受访问有偏见或商业敏感信息的影响。但是,生成连贯、安全和精心制定的数据资源的挑战仍然是一个持续的问题。随着组织在日常运营中获得更多数据,编制可用于提取的最新数据资源是一个持续的过程。因此,大数据可以被视为一种静态资产,而用于人工智能摄入的数据必须尽可能接近实时进行准备和处理。因此,情况仍然是机会、风险和成本之间的三方平衡。以前,供应商或平台的选择从未像对现代企业如此重要。