采用多模态信息进行金融信息预测,主要是时序信息和事件文本信息。
[[RoBERTa]] 采用RoBERTa进行文本编码。
[[MOMENT]] 采用了MOMENT进行时序编码。
[[因果推断]] 论文使用LLM生成反事实事件,以此扩充样本并强化模型对事件和时序信息的因果感知能力。 但是金融市场具有复杂性,如何确保不同事件会产生不同结果,换言之反事实事件的结果一定和原事件的结果相差甚远吗? 进一步阅读论文发现,作者采用控制生成策略,即采用1-10的情感分级和类型转换来进行生成,尽量生成差异化大的事件来避免这种问题。
[[三元组损失]] 采用三元组损失让模型理解因果学习机制。
损失函数
和的优化目标有所差异,前者目标是使预测结果更加贴近市场真实情况,后者希望模型能更好地学习到事件和市场数据的真实情况。 想到是否可以考虑采用分阶段训练来保证这两个不同的优化目标不产生冲突,前者是一个回归问题,后者是一个[[对比学习]]问题,且总损失为二者简单相加,导致权重一致,所以可以考虑分阶段训练来优化模型效果。 上述分阶段训练具体效果待尝试。