主要内容
百度发布最新基础AI模型:ERNIE 4.5与ERNIE X1,通过ERNIE Bot向个人用户免费提供。百度表示,通过提供更易于获取的高端功能,旨在“推动多模态和推理模型的边界”。这些模型将整合到百度的产品生态系统中,包括百度搜索引擎和文小雅应用,以提升用户体验。
ERNIE 4.5是百度的“新一代原生多模态基础模型”,实现多模态协同优化,提高多模态理解能力。它增强了语言理解、生成、推理和记忆功能,同时改进了“幻觉预防、逻辑推理和编码能力”。该模型能够整合和理解各种内容类型,包括文本、图像、音频和视频,还能理解复杂的网络迷因和讽刺漫画,展现出强大的上下文意识。百度声称,ERNIE 4.5在多个基准测试中表现优于GPT-4.5,而且价格仅为GPT-4.5的1%。这些进步归功于如“FlashMask”动态注意力掩码、异构多模态混合专家、时空表示压缩、以知识为中心的训练数据构建和自我反馈增强后训练等技术。
ERNIE X1是百度的新深思推理模型,专注于增强理解、规划、反思和进化能力。作为百度“第一个能够使用工具的多模态深思推理模型”,X1在中文知识问答、文学创作和复杂计算等领域表现出色。该模型支持如高级搜索、文档问答、图像理解、AI图像生成和网页阅读等功能。ERNIE X1的能力得到了渐进强化学习、端到端训练整合思维与行动链以及统一的多方面奖励系统等技术支持。
对于企业用户和开发者和,ERNIE 4.5可通过百度AI云的千帆平台上的API访问,具有竞争力的定价结构。ERNIE X1也将很快在同一平台上提供。百度预计“2025年将是大语言模型和技术发展和迭代的重要一年”,并计划继续投资AI、数据中心和云基础设施,以推动其AI能力的发展并开发下一代模型。