标题:当 AI 下场炒 A 股,「推理」成了新的直觉
正文:
近日,一场名为“AI Trading Battle”的实验引发热议。主办方让六个主流大模型(如 ChatGPT、Gemini 等)用虚拟资金进行加密货币交易,结果令人惊讶:DeepSeek V3.1 盈利率超 126%,而 GPT-5 和 Gemini 2.5 Pro 亏损超 50%。这场实验揭示了语言模型在复杂金融环境中的局限性:它们是否清楚“为何下单”?
对此,香港科技大学、美国罗格斯大学和南开大学的研究团队提出了一种名为 RETuning 的方法,让模型在预测前先搜集证据、分析逻辑并反思推理,从而实现“有理有据地思考”。基于中国 A 股市场的验证显示,RETuning 不仅显著提升了预测准确率,还增强了模型的可解释性和泛化能力,为金融领域的 AI 研究提供了新方向。
研究中,RETuning 模型在预测股票“上涨、持平、下跌”任务中表现优异,F1 分数比主流模型高出 10%-20%。即使面对未见过的数据,其表现依然稳定。此外,通过多次推理采样(8-16 次),模型能更慎重地决策,但过多思考会降低效果。
RETuning 的另一个亮点是可解释性。它不仅能给出预测结果,还会详细说明支持与反对的理由,输出接近人类分析师的逻辑报告。相比传统模型的模糊结论,RETuning 的回答更有条理,适合需要深度推理的金融场景。
实验过程同样严谨。研究团队构建了 Fin-2024 数据集,涵盖 5000 多只股票和 20 万样本,并采用三阶段训练:监督微调(SFT)、规则强化学习(Rule-based RL)和推理时扩展(Inference-Time Scaling)。最终,RETuning 在多个指标上超越对照模型,展现出综合优势。
尽管如此,RETuning 仍面临挑战。市场噪声和非理性波动可能影响模型表现,且算力消耗较高。目前实验仅限于 A 股市场,未来还需拓展到其他市场和时间段。不过,这项研究为提升 AI 在金融领域的应用潜力迈出了重要一步。
-
2025-10-28 14:53:35 -
2025-10-28 14:52:38 -
2025-10-28 14:51:29