为AI、ML和数字孪生模型建立可信数据
Posted 05/09/2024 by Eric Sivertson, VP of Security Business
在当今数据驱动的世界中,人工智能(AI)、机器学习(ML)和数字孪生技术正在深刻改变行业、流程和企业运营环境。每天产生的超过3.28亿TB数据已成为新“石油”——为下一代数字系统提供所需的能源。
然而,这些技术的有效性和可靠性很大程度上取决于数据的质量和可信度。建立可信数据不仅是先决条件,更是成功的AI、ML和数字孪生模型的基石。数据爆炸式增长为开发人员带来了各类安全挑战。随着越来越多的数据在设备、传感器和系统之间流转,发生泄露和攻击的可能性也越来越大。此外,随着海量数据推动人工智能、机器学习和数字孪生的发展,“技术奇点”事件的风险也在增加,即机器智能变得优于人类,从而导致不可预见的结果。
这些影响引发了对数据的更多担忧,特别是如何以可信任和负责任的方式提取和优化数据。由于数据经济只会继续增长,关键问题在于:我们今天如何“信任”数据?
定义可信数据及AI、ML和数字孪生模型方面的挑战
可信数据是利益相关者可以放心地用于制定决策、开发模型和推动创新的数据。虽然“信任”是一个人类术语,但当涉及到数据时,“信任”的概念通常是指数据溯源。数据溯源即记录在案的线索,清楚地显示了数据的来源和历史,包括数据来源、创建方式以及数据随的修改情况。它是确保数据质量和完整性的关键因素。建立数据溯源可实现从数据源头到当前使用状态的不间断信任链。
如今,大多数AI、ML和数字孪生模型都缺乏有效的数据溯源。事实上,数据溯源的要求、执行机制非常少见,也没有广泛认可的标准可以遵循。这使得当今的主要AI系统容易受到数据中毒、恶意训练和数据漂移的影响。数据中毒和恶意训练是指故意和恶意操纵训练数据,以有害的方式损害AI和ML模型的性能或完整性。通过将虚假数据注入算法或数据集,攻击者可以影响偏向、制造漏洞以、破坏模式或预测的准确性。
此外,未建立数据溯源时,可能会导致数据漂移。当用于训练AI和ML模型的数据属性随时间变化时(无论是由于底层数据分布、环境变化还是用户行为导致),都会发生这种情况,从而导致模型性能下降。
在AI、ML和数字孪生模型中开发数据溯源的解决方案
随着AI和ML模型以及数字孪生越来越普及,必须更加关注数据溯源和建立信任。为此,需要关注以下三个关键领域:
- 制定指南和标准,
- 实现不可更改数据选项,以及
- 建立合规和执行机制。
指南和标准
行业和政府标准机构必须开始创建和实施数据溯源指南,至少要求对模型的数据溯源进行一定程度的披露。以层级披露系统为例。在此系统中,级别0表示没有数据溯源,级别1表示披露了数据溯源,级别2表示有着完整的数据溯源,在整个数据生命周期有不间断的信任链。AI/ML模型和数字孪生将报告每个级别的合规百分比。
不可更改数据选项
不可更改数据选项是指记录后无法更改或删除的数据。区块链技术由于其去中心化特性和分布式系统,为实现不可更改的数据提供了一种解决方案。在区块链网络中,每笔交易或数据都以加密方式链接到前一笔交易或数据,一旦交易被添加到区块链中,几乎不可能修改或删除。这确保了数据的完整性和可信度,并建立数据溯源。
合规和执行机制
还需要建立合规和执行机制,建立数据溯源并提供信任。通过强大的合规措施,组织可以降低数据滥用的相关风险,并确保数据管理流程的透明度和问责制的实施。将独立的第三方验证纳入合规性框架可进一步增强数据溯源的可靠性。通过对标准和法规的遵守情况进行公正的评估,有助于降低利益冲突的可能性并确保了完整性。
此外,随着合规标准的发展,标准也应该不断调整。这保证了AI/ML模型和数字孪生正技术采用最新的实践和安全协议,能够适应威胁并保持信任。
利用FPGA进行可信数据处理
在可信数据方面,现场可编程门阵列(FPGA)的作用怎么强调都不为过。特别是在建立数据溯源方面,FPGA具有独特的优势,可以为安全的数据处理提供几个关键优势。
安全增强功能:最重要的是FPGA提供内置的安全功能(例如加密和身份验证机制),有助于在处理过程中保护数据。通过将FPGA集成到数据处理基础设施中,组织可以增强数据安全性,降低网络威胁和数据泄露的风险。
性能优化:通过将数据处理任务分担到FPGA上,组织可以增强AI、ML和数字孪生模型的性能。在优化的工作流程和高吞吐量加持下,组织可以处理大量数据,并促进跨不同溯源数据的高效管理和分析。
实时处理:FPGA的实时处理功能使组织能够以最小的延迟分析和响应数据流。这对于数据溯源非常重要,因为它可以确保更及时地记录数据活动和转换,并且数据溯源记录可以反映最新信息。
定制和灵活性:由于其高度可定制的特性,FPGA可以进行编程或重新编程以执行特定任务。这种灵活性可以优化数据处理流水线,从而捕获和管理数据溯源信息。它还能帮助组织根据其特定环境和要求调整溯源机制,从而提高溯源记录的准确性、完整性和相关性。
利用可信数据增强AI、ML和数字孪生
随着更多创新和技术变革的到来,数据将继续成为我们数字驱动世界的关键组成部分。因此,优先建立数据溯源对于增强AI/ML和数字孪生模型的信任度和可靠性至关重要。通过实施准则和标准、不可更改的数据选项和合规机制,开发人员可以增强对这些技术完整性和可靠性的信心,并确保与安全性相关的结果更加可靠。
通过将FPGA集成到数据处理流水线中,组织可以将性能、灵活性和安全性提升到新的水平,为构建可信可靠的AI解决方案奠定基础。了解更多有关FPGA及其在AI/ML和数字孪生模型数据溯源中的作用,请联系莱迪思团队。