最近,奇富科技跟复旦大学还有华南理工大学合作,搞了个直播聊聊信贷AI怎么定标准的事儿。主要是想让大伙儿知道,他们出了个叫FCMBench-V1.0的新东西。这东西专门给信贷场景用,用来测测AI在多模态感知、推理这些方面的表现。其实就是想找个大家都能认可的客观尺子,看看哪个模型在金融上真的行。 奇富那边负责多模态的杨叶辉就说了,金融圈选模型老是头疼没有统一标准。你看市面上的模型都说自己成绩好,可是拿啥来比较呢?而且实验室里跑的很顺的模型,到了真业务里未必灵光。所以这次他们就把FCMBench-V1.0推出来了,就是要给AI们定个规。这个基准的设计有三个大原则:公平、科学、还得能落地干活。 杨叶辉强调,这个基准设计得特别接地气。比如它就模拟了很多真的信贷业务风险场景,比如去看用户收入合不合理、纳税比例对不对,专门考验模型识别人脸欺诈和搞风险识别的本事。 他还说了,FCMBench就是要反哺金融圈,让它变成大家能用的公共资源,把AI的能力跟业务价值紧紧绑在一块儿。 从学术角度看复旦大学的陈涛教授觉得,金融领域现在太缺统一的评测数据集和标准了。他就觉得这个FCMBench-V1.0在这个领域里能算是数一数二的大标杆,说不定以后就是金融圈的“ImageNet”。 华南理工大学的许言午教授则是从产学研融合的角度来聊这事儿。他觉得现在AI在金融里用得太广了,不管是保险定价还是量化交易这些核心场景都离不开它。 他觉得这次的直播讨论挺有价值的。未来只要继续把这个FCMBench-V1.0运营好、让大家一起来共建开源生态,金融圈就能逐渐形成像ImageNet那样的环境了。到时候技术跟业务就能深度融合起来了。