马斯克旗下XAI推出Grok-1.5 Vision多模态AI模型 引领AI创新应用新浪潮
2024-04-15 10:00:38
来源:
金融界
作者:AI小顾
马斯克麾下的XAI人工智能公司于4月12日震撼发布首个多模态智能模型Grok-1.5 Vision,该模型不仅能够深度理解和解析文本信息,而且在处理各类非文本媒介如文档、图表、截图和照片的内容识别与理解方面展现出了前所未有的卓越性能。xAI官方公布的Grok-1.5V在RealWorldQA基准测试中成绩斐然,一举超越了包括GFT-4V、Gemini Pro 1.5在内的诸多业内主流竞品,彰显出其在多模态处理领域的领先地位。
开源证券深入分析认为,此次XAI的创新之举标志着国内外AI多模态模型技术能力的重大突破,随着这类模型商业化步伐的加快,其应用场景将愈发广泛,有望在影视制作、知识产权开发、广告营销、教育教学、音乐创作、游戏研发等多个领域中实现降本增效,重塑行业生态。此外,多模态模型之间的竞争也将有力推动AI训练所需的图像、视频、音频等多元类型数据的需求激增,催生相关数据市场的繁荣。
在市场响应方面,国内相关上市公司积极布局多模态AI技术。据悉,昆仑万维自主研发的大规模语言模型“天工3.0”定于4月17日正式启动公测,并将同期开放4000亿参数的MoE混合专家架构模型,为AI技术创新再添一把火。
另一边,拓尔思公司凭借其合规安全且涵盖中文、图文、视频等多种模态的丰富语料库资源,已在业内脱颖而出,目前已为包括小米、云之声、云天励飞等在内的众多头部大模型厂商提供优质的预训练数据集服务,进一步印证了高质量多模态数据对于AI模型发展的重要性,也为相关产业链的纵深发展提供了强有力的数据支撑。
全部评论