当前位置:首页 > 最新文章 > 正文

智象未来获新一轮亿元级融资,并推出参数超两千亿的图像大模型。

摘要: 智象未来于2024年5月20日发布自主研发的超2000亿参数图像大模型HiDream-O1-Image-Pro,基于原生全模态架...
智象未来于2024年5月20日发布自主研发的超2000亿参数图像大模型HiDream-O1-Image-Pro,基于原生全模态架构Unified Transformer(UiT),实现文本与图像的高效融合,同日完成新一轮亿元人民币融资,深创投、金浦投资等机构参与,该模型参数规模巨大,能够精准捕捉图像细节与复杂逻辑,并具备跨模态理解能力,未来将优化推理成本和硬件适配,推动中小企业及个人创作者便捷使用高质量图像生成服务。

2024年5月20日,人工智能领域的明星企业智象未来再次引爆行业关注,该公司正式发布了其自主研发的新一代图像大模型——HiDream-O1-Image-Pro,这一模型基于创新的原生全模态架构Unified Transformer(UiT)打造,参数规模突破2000亿大关,成为迄今为止全球范围内参数规模最大的原生全模态图像大模型之一。

同一天,智象未来还宣布完成了新一轮亿元人民币级别的融资,本轮融资吸引了多家知名投资机构的参与,包括深创投、金浦投资、财鑫资本以及复聚资本等,这一资金注入不仅为公司的技术研发和市场拓展提供了强有力的资本支持,也反映出资本圈对智象未来在AI视觉领域技术实力的高度认可。

这个参数规模超过2000亿的“巨无霸”模型,究竟意味着什么?在人工智能领域,“参数”是衡量模型复杂度和学习能力的关键指标,从早期的数百万级参数,到如今的千亿级别,每一次参数的大幅跃升,都对应着模型在理解图像细节、复杂场景逻辑以及跨模态信息融合方面的质变,智象未来的HiDream-O1-Image-Pro模型,凭借超过2000亿的参数,理论上能够对图像中的纹理、光影、物体关系甚至隐含的情感做出更为精准的捕捉与生成,它在生成一张包含夕阳、海浪与飞鸟的高清照片时,不再仅仅是简单的像素组合,而是能依据“金色夕阳的余晖洒在波光粼粼的海面,远处几只白鹭振翅欲飞”这样的语义描述,输出高度逼真且符合物理光照规律的高质量图像。

从技术架构上看,Unified Transformer(UiT)的设计初衷在于打破传统模态之间的壁垒,在过去,处理文本、图像、音频甚至视频各需要独立的模型,不仅部署成本高,协同响应也常常出现“语义鸿沟”,UiT架构通过一个统一的Transformer网络,一次性处理和融合视觉、语言等多维度的信息,使得模型天然具备了“全模态理解”能力,当用户输入一句描述性文字,模型不仅要分析文字中的关键词,还需结合上下文逻辑,最终在视觉空间中对齐这些信息,大幅提升了图文转换的准确性与本质一致性。

从市场背景来看,2024年以来,全球AI大模型进入了“下半场”的激烈竞争,全球头部企业纷纷开源或发布百亿、千亿级参数的多模态模型,从最初的文本聊天、代码生成,逐步向视频生成、3D建模等纵深领域拓展,而图像生成一直是其中应用极其广泛的赛点之一:从电商平台自动化商品图设计,到影视行业概念场面预演,再到个人用户的创意内容生产,对便宜、快速且高质量的图像模型需求呈指数级增长,许多用户逐渐发现,多的是“能用”的表层模型,真正理解的深层底层逻辑、在不同光线和不同生物角色下有顶级稳定性与延展性的大模型最终都将成为行业的稀缺资产。

在此背景下,智象未来的这次突破,带着更多深层布局的意图,据业内人士分析,模型规模虽大,但真正落地并变成可规模化使用的商业产品,背后涉及推理成本优化、模型部署的硬件适配以及算力控费,就这看来,本轮融资的部分资金很可能被用来优化推理服务器集群和云端推理的吞吐成本,同时完善基础模型的向量化搜索引擎能力,以便让千亿级参模板摆脱实验室静态试错场景,真正在初创企业、中型团队甚至个人创作者手中便捷使用。

当下,中国AI图像生成市场日臻火热,腾讯、百度的图像大模型提速,阿里云推出通义万相,Artline等以AI套壳开发爆量变现,随着行业发展走向理性和价值验证,投资人与用户的目光已逐渐从纯营销参数与评测榜单排名,转向产品端真实落地的适配性和边际效率,这也正是智象未来获得深创投、金浦投资等专业机构增资的原因之一:虽然目前账面数据和接口日活量尚未占据头牌,但其极完整的底层研究积累加上强调实用性算法的组织惯性,获得了稳健可持续预期评级的信任。

相信在不久后,随着HiDream-O1-Image-Pro对API接口的逐步放开与企业级后台场景的支持完善,我们不仅能在各种设计软件、直播互动小助理、线上海报创作平台上看到其背后引擎的影子,更多的中小企业也能够快速无技术门坎地享受到沉浸式高质量智像服务,展望更远的未来,当视频由千万亿参数量级的一体大蛋糕融通图像、语言、三维表达,那些过往被算力高门槛、专业软件门槛拒之门外的想象空间,或许将被这一技术重新唤醒。