主要内容
Mastercard 开发了一种大型表格模型(LTM),而非传统的语言模型(LLM),该模型基于交易数据训练,旨在解决数字支付中的安全与真实性问题。公司已利用数十亿张卡交易数据训练该基础模型,未来计划扩展至数千亿级数据规模。
训练数据包含支付事件及商户位置、授权流程、欺诈事件、拒付和忠诚度活动等关联信息。Mastercard 强调,训练前已移除个人身份标识,模型通过分析行为模式而非关注个体身份来降低隐私风险。尽管匿名化可能减少风险评估的细节信息,但大规模行为数据可弥补数据丰富度的损失。
LTM 架构与 LLM 不同,后者基于非结构化输入训练,预测序列中的下一个“token”(常被误称为单词),而 LTM 则分析多维数据表中字段间的关系,更接近纯机器学习而非人工智能。它通过识别可预测的关系,发现预设规则未捕捉的异常模式,被描述为“洞察引擎”,可整合至现有产品,优化工作流程。
技术层面,LTM 依托英伟达的计算平台和 Databricks 的数据工程与模型开发支持。其首个应用将落地网络安全领域,辅助现有的欺诈检测系统,提升异常交易识别能力。Mastercard 计划采用混合系统,结合现有流程与 LTM,简化模型管理并降低运营成本,未来或扩展至内部决策、忠诚度项目分析等场景。