光子计算在金融领域的应用研究
原标题为【光子计算在金融领域的研究应用——聚焦“光子金融科技”新方向】
本文引用地址://www.cazqn.com/article/202305/446505.htm作者 | 吴永飞 王彦博 沈亦晨 杨璇
光子计算作为前沿尖端技术之一,近年来蓬勃发展、逐步成熟,目前已基本具备与行业应用深度结合的可行性。本文立足金融领域业务实践,创新提出光子金融科技 (Photon FinTech)研究与应用领域,并将光子计算应用于风 险价值计量和账户欺诈识别等金融场景,以期为数字经济时代下 金融行业数字化转型发展提供基于光子科技路线的新动能。
一、数字经济时代呼唤光子金融科技
当前,随着ChatGPT的横空出世,大模型背后的底层算力支撑问题再次受到全球业界和学界的高度关注。可以预见,数字经济时代下,随着各行各业数字化转型发展的不断深化,叠加大模型参数量和训练效果的进一步升级迭代,目前基于电子计算的经典算力体系将面临巨大挑战。开辟光子计算新路径,已成为提高计算效率、降低计算功耗迫在眉睫的重要选项。光子计算作为前沿尖端技术之一,近年来蓬勃发展、逐步成熟,目前已基本具备与行业应用深度结合的可行性。本文立足金融领域业务实践,创新提出光子金融科技 (Photon FinTech)研究与应用领域,并将光子计算应用于风 险价值计量和账户欺诈识别等金融场景,以期为数字经济时代下 金融行业数字化转型发展提供基于光子科技路线的新动能。
一直以来,世界各国都高度重视光子技术研究。早在2005年,欧盟就将光子技术定为重点研发的技术之一,并组建了“光子科技21”欧洲技术平台。以德国为例,光子学是其国内发展最快的行业之一,已在半导体和医疗技术、光伏、机械工程、航空等领域发挥着关键作用。我国同样高度重视光子计算相关研究,从“十二五”规划时期开始,我国以光学仪器行业作为着力点,推动光学技术的完善与发展。
光子计算作为一项快速发展的新兴技术,不仅在技术上不断取得突破,近年来在商业应用方面也日益成熟。特别是对于金融行业而言,光子计算所带来的速度和效能优势天然地与金融行业的需求相匹配,光子金融科技这一新领域应运而生。一方面,光子金融科技有望满足金融机构对计算速度的严格要求。金融市场瞬息万变,每一笔资金都具有时间成本,特别是在金融市场类业务中,交易速度的差异往往会对组合收益带来显著影响。光子计算所带来的显著速度提升有望为金融机构在交易中提供“天下武功唯快不破”的优势。另一方面,光子金融科技有望满足金融机构海量数据样本的计算需求。金融机构是典型的数据密集型机构,具有海量的结构化与非结构化数据运算需求,亟需探索出一条以低成本来处理海量数据的算力提升路径。光子计算有望在该领域提出全新的破局思路。
二、光子计算的起源与发展
光子计算独具优势
立足当前的数字经济时代,回顾过往几十年的算力发展历程,传统提高芯片算力的方法是在仅仅只有指甲盖大小的芯片上集成晶体管,并不断加大集成密度。然而,随着人类社会数据量爆棚及人工智能的加速发展,人们对算力的需求激增,而芯片自身受物理极限限制,导致“摩尔定律”也面临失效的困境。为了突破电子芯片存在的一系列弊端,国内外学者们纷纷考虑从“电”向“光”进行转化,即利用光子计算代替传统电子计算中的计算密集型操作,从而达到提高算力、降低能耗的实用效果。
光子是一种静止质量为零的粒子,具有能量和动量。光子计算具有超强的并行处理能力及超高的运算速度。20世纪八九十年代,研究学者发现光学技术在信息处理方面具有巨大优势,而后掀起了光子计算研究的热潮。光子计算是一种基于光学信号处理的新型计算技术,具有高速度、低功耗、高并行度等优势,是未来信息技术领域的重要发展方向之一。在光子计算的诸多优势中,高速度和高效率两个优点尤为突出。在高速度方面,光子计算有着传统电子计算无法比拟的优点,它可以采用新的进制,比如三进制和四进制等,同时让成千上万条光在同一时刻穿越光子元件的不同通道,而且彼此之间互不干扰,这些优点使其具有超强的并行计算能力,可以对数据实现高速处理。在高效率方面,光子在光介质中传输信息损失极小,光在传输过程中的能量消耗和热量散发极低,因此光子计算可以在大规模计算中实现高效率的数据处理。
光子计算在国内外的发展如火如荼
国内外已有许多专家学者在光子计算的相关领域开展了研究探索。1964年,Vander Lugt使用光学相关器的方法,通过空间滤波器来对光信号实现相位补偿,并产生光信号计算结果。1990年前后,专家学者参考数字电子计算机的发展历史来对光子计算机进行了研究,主要成果涵盖逻辑器件、逻辑计算、时空编码及数字并行算法等各个领域。此后,研究学者们也针对光学计算中的光学模式识别、光子神经网络、逻辑光计算、光学全息存储等技术方向进行了研究,其中光子神经网络技术是一个重要的研究方向。
光子神经网络设计了存算一体的结构,有效解决了电子神经网络下对周期性数据读写异常的问题,它不仅提高了计算速度,同时也使计算时延降低。2017年,沈亦晨等人将硅基光电子技术和深度学习进行融合,提出一种全光卷积架构,在相关纳米光子芯片上实现了语音识别功能。2018年,Lin等人提出了一种光子深度神经网络结构,该结构基于光的衍射,能对MNIST手写数字数据集和Fashion-MNIST时尚产品数据集进行有效分类。2019年,费尔德曼等人利用相关芯片实现光学神经网络,并将其用于简单的英文字母识别。2022年,胡跃强等人提出了一种基于超构表面全光衍射神经网络的多任务智能感知芯片,它能在可见光下执行多个通道的低功耗、极速智能图像识别任务,其利用亚波长纳米结构的偏振复用方案,构建了一种多通道分类器框架,实现了对MNIST手写数字数据集和Fashion-MNIST时尚产品数据集的识别。
近年来,国内相关光子研究团队有了创新的技术突破。2019年,首款光子芯片原型板卡由曦智科技发布,光子芯片的诞生有效证实了光子能够替代电子来进行高性能计算的设想。2021年,第二代高性能光子计算处理器PACE(Photonic Arithmetic Computing Engine,光子计算引擎)的问世再次验证了光子计算的优越性。PACE主要利用了光计算的低延迟优势,更具体而言,通过矩阵乘法的叠加及受控噪声的紧密回环来实现低延迟,使得“伊辛问题”在PACE下仅在3纳秒就可以完成单次迭代计算,其计算速度远超当前顶端GPU计算。
三、光子计算在金融领域的应用
光子计算在风险价值计量中的应用
业务理解
金融机构是经营风险的专业机构,对风险的价值计量能力是金融机构的核心竞争力之一。自2022年1月1日《关于规范金融机构资产管理业务的指导意见》施行以来,理财产品打破“刚性兑付”,如何有效提升对金融产品的风险管理和风险价值计量能力再次引发了行业的高度关注。
风险管理是识别和度量风险、检验承担风险是否与预期风险一致的重要过程。管理市场风险的过程在很大程度上依赖于模型的使用,金融模型提供了管理投资风险所必需的关键信息。投资风险模型可以帮助投资组合管理者洞察风险因子发生变化时对投资组合的影响,了解投资组合未来收益和波动,以及可能发生的重大损失,在已打破“刚兑”的当前具有现实意义。
风险价值(Value at Risk,VaR)是在假定的市场条件一段时间内,在一定显著性水平(通常为1%或5%)内预期的最小损失。在不同交易单位或投资组合头寸之间比较风险价值,能够为决策者提供一个可用于资本配置的基准。风险价值计量通常采用三种方法,分别为参数法、历史模拟法和蒙特卡洛模拟法,这些方法需要根据产品复杂程度进行金融建模,从而得到风险价值。然而,蒙特卡洛等传统风险定价方法往往需要进行大量路径的模拟,需要消耗相对较长的时间。面对复杂的金融市场变化和海量的数据,如何既快速又准确地计量出风险价值,一直是困扰相关金融从业者的难题之一。本文创新性地将光子计算运用于金融风险价值计量场景,依托光子计算的高速传输特性,帮助金融从业者快速获取所需资产路径数据并迅速做出拟合计算,从而实现高效的风险价值计量。以表1中的某理财产品为例,实证分析结果如下。
表1 理财产品A要素示例
表2 风险价值计量参数表
数据理解
本文创新性地应用光子神经网络算法对传统的蒙特卡洛方法进行替代,从而实现对投资组合风险价值(VaR)的高效计量。本文依托光互连技术,能够实现大规模、高速、实时风险价值计量任务。风险价值计量过程主要分为训练和推理两个阶段,其中:训练阶段是离线完成的,运用提前准备好的训练数据进行深度神经网络训练,并通过大量运算把训练好的模型部署到适配的光子计算设备上;推理阶段则是在线过程,将实时性数据推送至光子计算设备,依托光子计算低能耗、高速率等特性,通过实时推理得到风险价值计量值。通过离线训练和在线推理相结合的方式,满足各品类实时风险价值计量需求。
离线训练过程主要应用模拟数据来训练深度神经网络模型以适配光子计算网络,包含数据准备、模型训练、模型验证等步骤。在数据准备过程中,首先针对对应投资组合产品特点,确定影响产品风险敞口的固定参数及可变参数有效区间,如均值范围、方差范围、标的初始价格、标的计算周期等(见表2)。其次,在对应的参数区间,采用均匀采样的方式生成一组定价输入参数,并将各参数值输入模型,而后进行5万次蒙特卡洛路径模拟,得到对应的风险价值计量值;以此方式离线生成数据,并将生成的500万条数据样本,按照8∶1∶1的比例划分为训练、验证及测试数据集。
模型构建
在模型训练过程中,首先针对光子计算加速特性,设计专用的矩阵计算密集型风险价值计量神经网络结构,并进行随机初始化。其次,利用数据准备阶段获得的训练数据集,训练出运行于光子计算设备上的风险价值计量神经网络模型。模型结构采用共6层且除输入及输出层外每层1024个节点的多层全连接网络,能够有效利用光子计算擅长矩阵运算推理的特性,以实现加速推理。当完成模型训练及验证后,固定模型并部署权重。
模型评估
在线部署阶段,将离线训练阶段训练好的模型导入光子计算软件栈中,进行量化适配,并将模型部署到光子计算设备上,最终通过在线部署的方式实现对金融风险价值的实时计量。
从风险价值计量结果的精度来看,光子深度神经网络算法模型的计量精度随路径增多会逐渐逼近风险价值公允精度。本文以决定系数R²作为光子深度神经网络模型结果与经典蒙特卡洛模拟算法结果之间拟合效果的评估指标,实证结果表明:光子计算模型的风险价值计量精度随离线训练数据量的不断增加而增加。随着训练数据量的增大,光子计算风险价值计量精度能够逐渐保持在99%以上(见图1)。未来,随着待估计产品种类及参数的增加,光子深度神经网络算法模型优势较其他模型将有望更加凸显。
图1 不同样本量训练集下光子计算金融资产风险价值计量模型精度
从风险价值计量任务的计算速度来看,使用传统CPU进行蒙特卡洛模拟5万条路径需要528毫秒;而通过上述全连接网络训练后,分别使用GPU计算及光子计算进行推理运算,其中使用8纳米制程工艺的英伟达A10处理器用时893微秒,而实现同样需求的光子计算使用的是28纳米制程工艺但用时仅712微秒。在测试数据集上,光子计算风险价值计量模型的推理速度比采用传统CPU蒙特卡洛算法得到相似结果快数百倍;同时采用先进制程GPU计算模型实现推理的时间是采用该光子计算推理算法模型的1.25倍(见图2)。
图2 CPU与GPU和光子计算关于风险价值计量模型推理时间的对比(单位:微秒)
实证研究结果表明,针对风险价值计量问题,采用光子深度神经网络算法模型进行推理的计算速度显著优于传统的CPU蒙特卡洛模拟算法;且光子深度神经网络算法模型可以以低工艺制程(28纳米)获得更优于先进制程(8纳米)的计算速度优势。
光子计算在银行账户欺诈识别中的应用
业务理解
数字经济时代下线上支付手段的快速发展,在为金融机构用户提供便捷服务的同时,也对金融行业提出了新的挑战。近年来,跨境赌博、电信网络诈骗等涉赌涉诈案件剧增、方式手法多样,呈现出线上化、产业化、交易链条复杂、易派生洗钱和其他涉诈等特点,对人民群众财产安全和社会安全稳定造成了不良影响。以商业银行为代表的金融机构作为维护国家金融安全稳定的重要力量之一,承担着构建牢固“防火墙”的责任使命。2022年12月1日起施行的《中华人民共和国反电信网络诈骗法》已将反欺诈工作上升到了国家法律层面。该法中专门设立了“金融治理”章节,明确了银行业等金融机构的反诈职责,指出“银行业金融机构、非银行支付机构应当对银行账户、支付账户及支付结算服务加强监测,建立完善符合电信网络诈骗活动特征的异常账户和可疑交易监测机制”。
以商业银行为例,银行业务的交易流水可以看作为一个复杂的图网络结构,一些涉赌、涉诈及相关联团体往往呈现出一些“群体”特点。如何从复杂的交易网络结构中发现有欺诈特征的社区已经成为一项重要的任务。本文从图社区发现的视角出发,将商业银行的账户欺诈识别任务转化为“伊辛模型”问题,并创新性地应用光子计算进行求解,以期高效地从图数据中发现涉赌涉诈及值得关注的相关联账户。
数据理解
本文采用国内某全国性股份制商业银行2020年3月1日至5月31日包含涉诈账户和欺诈行为的交易流水数据,数据集包括账户数据、交易数据、样本数据三大类,其中:账户数据包括账户号、账户所属机构、账户开户日期等;交易数据包括交易流水号、账户号、对手账户号、交易金额、账户余额、对方行号、交易日期、交易时间、交易渠道、摘要代号等;样本数据包括账户号、业务标志等。本文聚焦涉赌涉诈及相关联业务场景,并综合考虑客户地域、交易对手特征、交易金额、转账频率、交易时间等业务关注的重点特征,提取出该类业务图数据的一张子图。从业务实际来看,该场景数据集为典型的小样本学习图数据集,包含66个账户节点和60笔交易,旨在从中发现涉赌、涉诈及存有其他相关联问题的社区。
模型构建
如前所述,面向该小样本学习图数据集的欺诈识别问题,可以被转化为社区发现问题,即在一整张网络中,将网络中的节点划分为若干社区,从而发现包含涉赌、涉诈账户及其他相关联账户的社区。传统的社区发现算法包括图分割算法、层次聚类算法、分割式聚类算法和基于模块度的算法等。经典的Kernighan-Lin算法就是解决该类问题的重要方法之一。Kernighan-Lin算法常用于复杂网络聚类问题,其核心目标是使社区间连接数与社区内连接数之间的差值最小化。然而,经典的社区发现算法往往被认为难以在多项式时间内得到满意的计算结果,因而在实际应用中面临不小的挑战。
本文创新采用光子计算将该欺诈识别问题转化为对社区发现问题进行求解,并通过与经典Kernighan-Lin算法模型进行对比,从而达到提升效率、节约时间、提高模型准确性的目的。具体而言,在光子计算视角下,可将社区发现问题转化为二次无约束二值优化问题(Quadratic Unconstrained Binary Optimization, QUBO),而QUBO问题和伊辛模型是一一对应的,其数学表达式为:
min f = XTQX
其中,X=(x1,x2,…,xn )T,xi∈{0,1};Q为n×n的权重矩阵,它是通过邻接矩阵得到的。本文使用光子计算对上述问题进行求解:
首先通过电光转换单元,将权重矩阵Q转换为光权重信号,并加载到光子器件上;同时初始化一组输入向量X,并将其转化为光输入信号;然后通过硅基芯片上实现的数万个光学器件,实现一次高速低功耗的大规模矩阵计算,最终经过光电转换单元将结果转换为电信号,并将其分成两部分,一部分用于能量计算,另一部分用于迭代。其中,下一次迭代使用的输入向量是在前一步的基础上加上随机扰动得到的,每次可在纳秒量级完成一次端到端的算法迭代。
模型评估
在求解过程中,损失函数随着迭代次数发生变化的曲线如图3所示。不难看出,模型通过迭代后可较快地收敛到一个稳定水平,此时可以理解为社区划分任务达到了最佳社区分割状态。
图3 社区发现问题迭代求解过程中损失函数变化情况
从算法实现时间来看,实证研究结果表明:光芯片实现矩阵乘法在求解特定规模的社区发现问题时,较现有算法具有显著的性能优势。与传统GPU相比,光子伊辛问题求解算法可展现出上百倍的速度优势,具体计算时间情况如图4所示。
图4 光子计算与GPU计算在社区发现问题中单次迭代所耗时间对比(单位:纳秒)
从模型准确性方面来看,在该小样本学习图数据集上,模型的构建天然面临着较大挑战。如表3和表4所示,经典的Kernighan-Lin算法模型在该数据集上是将全部账户节点平均分为两群,经业务排查,涉赌涉诈的账户节点(真实标签为1的节点)被平均分在两群中,对于本文社区发现和欺诈识别问题而言效果不佳。而采用基于光子计算的伊辛模型结果显示,实际发生涉赌涉诈的账户节点被较为有效地划分进了同一社区,并为业务人员有效锁定与涉赌涉诈相关联的其他问题行为及相关账户提供了依据,起到了事半功倍、降本增效的良好应用效果。
表3 基于Kernighan-Lin算法构建模型的混淆矩阵
表4 基于光子计算构建模型的混淆矩阵
进一步将经典的图分区Kernighan-Lin算法模型与光子计算模型结果指标进行对比:在当前小样本学习图数据集上,针对涉赌涉诈相关账户识别任务,Kernighan-Lin算法模型的查全率为0.5、查准率为0.09、F1-score为0.15;而光子计算模型的查全率为0.83、查准率为0.15、F1-score为0.26。光子计算模型在上述三个指标方面均表现优于Kernighan-Lin算法模型。
随着未来相关欺诈识别业务的进一步发展,在处理更大规模(甚至超大规模)交易图数据时,得益于数据规模的增大,模型准确性指标有望得到自然提升,同时光子计算模型的计算效率优势将进一步得到凸显,具有可观的应用价值和广阔的应用前景。
四、结语
数字经济时代下,光子金融科技作为提高金融业务与管理的计算效率、降低其计算功耗的新路径应运而生。本文立足金融行业应用视角,创新性地将光子计算应用于风险价值计量和账户欺诈识别业务场景,构建了较经典电子计算技术更优的应用模型,为光子计算在金融领域的应用提供了新思路。
此外,光子计算在金融行业还具有广阔的应用场景:一是可应用于金融衍生品的定价,特别是以障碍期权为代表的较为复杂的金融衍生品定价场景;二是结构化金融产品的定价,例如双重货币债券的产品组合分析场景;三是金融图计算中除社区发现以外的社交网络分析以及知识图谱应用;四是自然语言处理在金融领域的应用,包括但不限于智能客服、客户情绪识别、合规制度问答等应用场景;五是计算机视觉在金融领域的应用,包括但不限于人脸识别、光学字符识别等应用场景。
未来,应进一步聚焦光子金融科技的技术创新与深化应用,为金融机构数字化转型发展提供更强有力的算力支撑,为数字经济时代下全社会广泛应用光子科技起到示范性效用。
【参考文献】
1. Shen Y, Harris N C, Skirlo S, et al. Deep learning with coherent nanophotonic circuits[J]. Nature photonics, 2017, 11(7): 441-446.
2. Wetzstein G, Ozcan A, Gigan S, et al. Inference in artificial intelligence with deep optics and photonics[J]. Nature, 2020, 588(7836): 39-47.
3. Roques-Carmes C, Shen Y, Zanoci C, et al. Heuristic recurrent algorithms for photonic Ising machines[J]. Nature communications, 2020, 11(1).
4.王硕. 量子光学中的蒙特卡洛方法研究[J]. 科技资讯, 2015(15):7-9.
5.李树. 光子与相对论麦克斯韦分布电子散射截面的蒙特卡罗计算方法[J]. 物理学报, 2018, 67(21):268-276.
6. 方轶圣. 面向光学模拟计算的空间微分器和光学伊辛模型[D]. 浙江大学, 2020.
(上海曦智科技有限公司陈辰、陈章、杨春、黄洋,龙盈智达﹝北京﹞科技有限公司张月、王一多、徐奇、王子珺、曹晓峰、冯琳、高新凯、王学志、李婷婷、吕鹏对本文亦有贡献)
作者单位:华夏银行股份有限公司,龙盈智达(北京)科技有限公司,上海曦智科技有限公司,其中吴永飞系华夏银行首席信息官、信息科技部总经理
责任编辑:董 治
Yhj_dz@126.com
文章刊发于《银行家》杂志2023年第4期「金融科技」栏目(有删节)
评论