神经网络 + 模型校准文献总结
总结使用神经网络校准随机波动率模型参数的相关文献。
神经网络 + 模型校准文献总结
概述
定价模型参数的校准是金融工程实践中一个非常重要的问题,校准问题可以看作是一个最优化问题:
\[\underset{\Theta \in R^n } {\arg \min}\ C\left(V(\Theta;\Phi) - V^{Mkt}\right)\]$V^{Mkt}$ 是市场上观测到的报价,可以是期权价格、隐含波动率或者利率;$V(\Theta;\Phi)$ 表示模型参数 $\Theta$ 到理论报价的映射,$\Phi$ 是一系列外在参数,例如到期时间;$C(\cdot)$ 则是损失函数。
校准问题的难点有两个,
- 首先是最优化计算,需要处理的损失函数一般是一个高度非线性的函数,要得到全局最优点的话一般是一件高成本的事,例如若果选择使用差分进化算法的化需要大量的重复估值计算;
- 其次,$V(\Theta;\Phi)$ 本身可能就是一件耗时的工作,有些复杂模型的估值不存在解析(近似)解,需要依赖 FDM 或 Monte Carlo 等计算方法。
在解决校准这个老大难问题的过程中,人工智能作为新质生产力自然引起了学者们的主意。用人工神经网络(ANN)来处理模型校准的最早尝试可能来自于文献【1】,借助 ANN 强大的表现力(即通用逼近定理)、开源软件和高速硬件的发展,近些年涌现出越来越多这方面的文献。
用 ANN 来处理模型校准的方式大致分为两种,直接法与间接法。
直接法
优化问题
\[\underset{\Theta \in R^n } {\arg \min}\ C\left(V(\Theta;\Phi) - V^{Mkt}\right)\]暗示了存在 $V^{Mkt}$ 到 $\Theta$ 的映射关系,直接法就是用 ANN 来表示这种映射关系,即直接输入观测报价就可以输出模型参数。文献【1】中用前馈神经网络(FNN)和卷积神经网络(CNN)来校准 Hull-White 利率模型,对于涉及利率期限结构的校准问题提出了一个生成大量训练数据的方法;文献【2】将隐含波动率(IV)曲面视为一个“图像”,用 CNN 表示曲面到 Heston 模型参数的映射关系,并且对校准结果做了贝叶斯统计分析;文献【3】用 FNN 校准 G2++ 利率模型,并且用 PCA 对市场数据做了特征工程;文献【4】用 FNN 校准粗糙随机波动率(rSV)模型,提出了用随机网格法生成训练用的 IV 曲面。
间接法
和一步到位的直接法不同,间接法将校准分两步走:
- 第一步,用 ANN 建立模型参数到观测报价的映射关系 $V^{\ast}(\Theta,\Phi)$,例如 Heston 模型参数到隐含波动率的映射;
- 第二步,在第一步的基础上将原始的优化问题被转化为 $\underset{\Theta \in R^n } {\arg \min}\ C\left(V^{\ast}(\Theta;\Phi) - V^{Mkt}\right)$,再用传统的优化计算方法(例如差分进化和 Levenberg-Marquardt)求解这个问题。
间接法将高成本的 $V(\Theta;\Phi)$ 替换成低成本的 $V^{\ast}(\Theta,\Phi)$,以此来减少校准问题的整体计算量。
文献【5】用 FNN 建立 rSV 模型参数到 IV 的映射关系,再用 Levenberg-Marquardt 算法做优化;文献【6】用 FNN 建立 Heston 模型参数到 IV 的映射,但是采用全局优化算法——差分进化;文献【7】用 FNN 建立模型参数到 IV 曲面的映射,再用传统方法做优化计算,包括基于梯度的算法和无梯度算法;文献【8】和文献【9】分别用间接法校准 GARCH 型期权定价模型和 Trolle-Schwartz 利率模型。
比较直接法和间接法
直接法的优势在于可以根据市场报价直接给出校准结果,但直接法的训练和应用高度依赖于输入数据的结构,如果输入是 IV 曲面的话可能需要根据“期限 x 执行价格”张成的不同网格训练不同的神经网络。
间接法对输入数据的结构没有那么依赖,但是第二步中依赖传统优化算法,使得整体的计算成本高于直接法。
两种方法更细致的比较可以参考文献【10】、【11】和【12】。
一些高级话题
大部分校准问题面对的模型是一个纯粹的参数模型,例如 Heston 模型。这种情况下 FNN 和 CNN 等不是太复杂的网络架构比较适用。当校准问题中出现非参数结构时,需要一些更高级的神经网络架构,文献【13】和【14】应用了 Neural SDE 和生成式对抗网络(GAN)技术,采用 FNN 参数化随机局部波动率模型中的杠杆函数(leverage function)来校准模型参数和非参数的杠杆函数。
尽管 $V(\Theta;\Phi)$ 可能没有解析表达式,但通常可以保证是可微的,为了利用可微性,文献【15】应用 Differential Machine Learning 技术用间接法校准模型参数,并且和基于 FNN 的校准方法作了比较。
参考文献
【1】Model Calibration with Neural Networks
【2】Volatility Model Calibration With Convolutional Neural Networks
【3】Fast Direct Calibration of Interest Rate Derivatives Pricing Models
【4】Deep Calibration With Random Grids
【5】Deep Calibration of Rough Stochastic Volatility Models
【6】A Neural Network-Based Framework for Financial Model Calibration
【7】Deep Learning Volatility: A Deep Neural Network Perspective on Pricing and Calibration in (rough) Volatility Models
【8】Deep Calibration With Artificial Neural Network: A Performance Comparison on Option Pricing Models
【9】Deep Calibration of Financial Models: Turning Theory into Practice
【10】On Deep Calibration of (rough) Stochastic Volatility Models
【11】Volatility Model Calibration with Neural Networks a Comparison between Direct and Indirect Methods
【12】Deep Calibration of the Quadratic Rough Heston Model
【13】A Generative Adversarial Network Approach to Calibration of Local Stochastic Volatility Models
【14】FX Volatility Calibration Using Artificial Neural Networks
【15】Applying Deep Learning to Calibrate Stochastic Volatility Models