美国运通(American Express)正在测试利用一项新技术打击金融欺诈。这项技术以能够帮助制作深度伪造视频而著称,这些视频里的人说过的话事实上根本不存在。
美国运通希望利用这项技术创建虚假的财务数据,例如信用卡交易等,并将这些数据输入到机器学习算法当中,从而帮助他们更有效地发现信用卡欺诈等问题。公司的目标是,一旦客户的账户被盗,在犯罪分子大肆消费之前更快提醒客户。
美国运通的研究其核心是名为生成对抗网络(GAN)的人工智能技术,这种技术被用于创作深度伪造视频。最近几年,这项技术不断完善,可以帮助创作让观众们信以为真的视频。
例如,两年前,华盛顿大学(University of Washington)的研究人员利用GAN技术创作了一条美国前总统贝拉克·奥巴马发表演讲的逼真视频,但这次演讲根本是子虚乌有。最近,麻省理工学院(MIT)的高级虚拟技术中心(Center for Advanced Virtuality)创作了一条美国前总统理查德·尼克松在“阿波罗11号”登月任务失败之后发表演讲的深度伪造视频,视频中的演讲同样是不存在的。
在创作这条视频时,麻省理工学院的研究人员使用尼克松演讲的音频片段对GAN软件进行训练,使其能够学会调整演员的声音,让其听起来更接近前总统的声音。美国运通的研究人员则利用正常情况下用于计算消费者信用积分等任务的内部数据对GAN软件进行训练,从而使该软件可以自行生成财务数据。
美国运通的机器学习研究副总裁德米特里·埃菲莫夫表示,公司的目标是GAN软件能够创造出“看起来正常的”虚假交易。存在明显异常的数据效果会大打折扣,比如某一天在纽约市多次购买厕纸,第二天在加利福尼亚州贝克斯菲尔德买了一台割草机。
关于美国运通如何利用人工合成的财务数据完善欺诈识别这个问题,埃菲莫夫拒绝置评,他说犯罪分子可能利用相关信息牟利。但一般来说,公司掌握的财务数据越多,就可以进一步完善其网络安全系统。
还有一些公司也在研究利用GAN技术创建人工合成财务数据,比如在线零售业巨头亚马逊(Amazon)。2018年,亚马逊发布了一份利用软件创建人工合成电商交易数据的报告,这些数据最终能够用于“产品推荐、锁定交易和模拟未来事件等”。
密歇根大学(University of Michigan)的研究人员也发表了一篇使用GAN技术创建虚假股市订单的论文。密歇根大学的计算机科学系博士候选人王欣曈解释说,这些信息可以用于揭露股市操纵行为。
然而,美国运通的研究人员今年在年度神经信息处理系统大会(Conference on Neural Information Processing Systems)上发表的一篇论文中表示,使用GAN技术创建虚假财务数据的效果很难评价。
对于人工智能生成的图片,人类可以简单地看着图片来判断它们与真实的物体是否相像。但研究人员表示,使用该项技术创建财务数据的做法是全新的尝试,没有一种“公认的方法”可以供研究人员用于对软件进行分级。
最终,美国运通的研究人员选择使用统计方法分析人工智能生成的数据,他们发现由此得出的结果还算理想,但不够完美。他们计划在未来研究中进一步完善这些方法。
研究人员非常乐观地认为他们的工作将带来回报。比如他们在论文中写道,训练欺诈识别模型所需要的公开的财务数据不足,而人工智能研究人员可以对外公开人工合成的数据集。他们在论文中解释说,这样做有利于这个领域的进步,因为其他研究人员能够在此基础上开展深入研究。但美国运通的发言人称,该金融公司没有公开相关数据的计划。
研究人员写道:“使用这种方法可以保护客户的个人数据和隐私。”(财富中文网)
译者:Biz
美国运通(American Express)正在测试利用一项新技术打击金融欺诈。这项技术以能够帮助制作深度伪造视频而著称,这些视频里的人说过的话事实上根本不存在。
美国运通希望利用这项技术创建虚假的财务数据,例如信用卡交易等,并将这些数据输入到机器学习算法当中,从而帮助他们更有效地发现信用卡欺诈等问题。公司的目标是,一旦客户的账户被盗,在犯罪分子大肆消费之前更快提醒客户。
美国运通的研究其核心是名为生成对抗网络(GAN)的人工智能技术,这种技术被用于创作深度伪造视频。最近几年,这项技术不断完善,可以帮助创作让观众们信以为真的视频。
例如,两年前,华盛顿大学(University of Washington)的研究人员利用GAN技术创作了一条美国前总统贝拉克·奥巴马发表演讲的逼真视频,但这次演讲根本是子虚乌有。最近,麻省理工学院(MIT)的高级虚拟技术中心(Center for Advanced Virtuality)创作了一条美国前总统理查德·尼克松在“阿波罗11号”登月任务失败之后发表演讲的深度伪造视频,视频中的演讲同样是不存在的。
在创作这条视频时,麻省理工学院的研究人员使用尼克松演讲的音频片段对GAN软件进行训练,使其能够学会调整演员的声音,让其听起来更接近前总统的声音。美国运通的研究人员则利用正常情况下用于计算消费者信用积分等任务的内部数据对GAN软件进行训练,从而使该软件可以自行生成财务数据。
美国运通的机器学习研究副总裁德米特里·埃菲莫夫表示,公司的目标是GAN软件能够创造出“看起来正常的”虚假交易。存在明显异常的数据效果会大打折扣,比如某一天在纽约市多次购买厕纸,第二天在加利福尼亚州贝克斯菲尔德买了一台割草机。
关于美国运通如何利用人工合成的财务数据完善欺诈识别这个问题,埃菲莫夫拒绝置评,他说犯罪分子可能利用相关信息牟利。但一般来说,公司掌握的财务数据越多,就可以进一步完善其网络安全系统。
还有一些公司也在研究利用GAN技术创建人工合成财务数据,比如在线零售业巨头亚马逊(Amazon)。2018年,亚马逊发布了一份利用软件创建人工合成电商交易数据的报告,这些数据最终能够用于“产品推荐、锁定交易和模拟未来事件等”。
密歇根大学(University of Michigan)的研究人员也发表了一篇使用GAN技术创建虚假股市订单的论文。密歇根大学的计算机科学系博士候选人王欣曈解释说,这些信息可以用于揭露股市操纵行为。
然而,美国运通的研究人员今年在年度神经信息处理系统大会(Conference on Neural Information Processing Systems)上发表的一篇论文中表示,使用GAN技术创建虚假财务数据的效果很难评价。
对于人工智能生成的图片,人类可以简单地看着图片来判断它们与真实的物体是否相像。但研究人员表示,使用该项技术创建财务数据的做法是全新的尝试,没有一种“公认的方法”可以供研究人员用于对软件进行分级。
最终,美国运通的研究人员选择使用统计方法分析人工智能生成的数据,他们发现由此得出的结果还算理想,但不够完美。他们计划在未来研究中进一步完善这些方法。
研究人员非常乐观地认为他们的工作将带来回报。比如他们在论文中写道,训练欺诈识别模型所需要的公开的财务数据不足,而人工智能研究人员可以对外公开人工合成的数据集。他们在论文中解释说,这样做有利于这个领域的进步,因为其他研究人员能够在此基础上开展深入研究。但美国运通的发言人称,该金融公司没有公开相关数据的计划。
研究人员写道:“使用这种方法可以保护客户的个人数据和隐私。”(财富中文网)
译者:Biz
American Express is testing technology that is best known for helping create deepfake videos—realistic clips of people saying things they never really said—to fight financial fraud.
In this case, the company is creating fake financial data like credit card transactions that it can feed into machine-learning algorithms to better help them spot credit card scams and other problems. The goal is to more quickly alert customers that their accounts have been compromised, before criminals have a chance to go on spending sprees.
At the heart of American Express’s research is the A.I. technology known as generative adversarial networks, or GANs, which are used to create deepfake videos. In recent years, the technology has improved to the point that it can help create convincing video clips that fool viewers.
Two years ago, for instance, University of Washington researchers used GANs to create a realistic-looking video of former President Barack Obama giving a speech that he never actually gave. More recently, MIT’s Center for Advanced Virtuality lab created a deepfake video of former President Richard Nixon giving a bogus speech about the Apollo 11 moon landing mission failing.
In the case of the fake Nixon clip, MIT researchers trained GAN software on audio clips of Nixon’s speeches so that it could learn to modify an actor’s voice to sound like the former President’s. American Express researchers, on the other hand, trained their GANs on internal data that is normally used for tasks like calculating consumer credit scores, so that the software could create its own financial data.
The goal was for the GANs to create fake transactions “that look normal,” said Dmitry Efimov, the vice president of machine learning research for American Express. Data with obvious anomalies, such as multiple purchases of toilet paper in New York City on one day, followed by a lawnmower purchase in Bakersfield, Calif., the next, would be less effective.
Efimov declined to comment about how American Express could specifically use synthetic financial data to improve fraud detection, citing the risk that criminals could use the information for their benefit. But, generally speaking, the more financial data the company has, the more it can improve its cybersecurity systems.
Other organizations that are researching using GANs to create synthetic financial data include online retailing giant Amazon. In 2018, Amazon published a paper about using the software to create synthetic e-commerce transactions so that the data could eventually be used for “product recommendation, targeting deals, and simulation of future events.”
Researchers at the University of Michigan have also published a paper about using GANs to create fake stock market orders. That information could be used to help uncover stock market manipulation schemes, explained Xintong Wang, a Ph.D. candidate in the University of Michigan’s computer science department.
Still, as American Express researchers described in a paper they presented at this year’s annual Conference on Neural Information Processing Systems, it’s difficult to evaluate how effective the GANs are at creating fake financial data.
Humans can easily look at A.I.-generated images to see if they resemble the real thing. But with financial data, the technology is so new that there are no “commonly accepted techniques” that the researchers can use to grade the software, they wrote.
The American Express researchers ended up using statistical techniques to analyze the A.I.-generated data and found that the results were good but not great. The researchers plan to refine their techniques for future research.
Ultimately, the researchers are optimistic that their work will pay off. As they described in the paper, there’s a lack of publicly available financial data that they can use to train their fraud-detection models. A.I. researchers could release their synthetic data sets to the public, which would be beneficial because other researchers could build on the work, the researchers explained in the paper. But an Amex spokesperson said the financial firm has no plans to do so.
“Customers’ personal data and privacy would be protected using this approach,” the researchers wrote.