科大讯飞:讯飞星火V4.0全面对标GPT-4 Turbo并完成在APP/Desk上的版本部署,排名语数外各科“成绩”第一

7月8日消息,有投资者在互动平台向科大讯飞提问:你好。雪球和知乎上有大量用户反馈,目前网页端和API上的星火V4相比于星火V3.5智能上基本没有提升,猜测公司还没有完成V4的布暑,是这么回事吗?我自己的使用体验也是一样的,V4和V3.5没有区别,甚至数学能力更差了。谢谢回答。

公司回答表示:2024年6月27日,“讯飞星火大模型”如期升级,升级发布的讯飞星火V4.0不仅在底座能力上全面对标GPT-4 Turbo(在国际知名的HumanEval、WinoGrande、GPQA等10项英文评测和C-Eval、CMMLU等2项中文评测中,8项超过GPT-4 Turbo),并且发布了面向教育、医疗、汽车和企业智能体等多款软硬件产品,充分展现了公司在大模型应用落地方面的领先能力。目前已完成讯飞星火V4.0在APP/Desk上的版本部署。根据中国科学报报道多家大模型在2024高考语数英三科中的表现,讯飞星火语数外各科“成绩”均排名第一,被评为“更会做题的大模型”;在复旦大学自然语言处理实验室发布的2024高考数学新I卷、新II卷客观题评测中,讯飞星火在更符合人类实际使用大模型时所采用的Latex格式测评中均超过GPT-4o。

责任编辑:十八
AI智能分析该文,为您挖掘投资机会该AI功能处于试用阶段,内容仅供参考,请仔细甄别!
展开
精彩推荐
加载更多
全部评论
热榜
关闭 下载金融界app
金融界App
金融界微博
金融界公众号