主要内容
在阿里巴巴云举办的杭州飞天大会上,中国的人工智能初创企业强调了他们开发大型语言模型的努力。这些公司的努力是在 OpenAI 发布最新语言模型之后,包括由微软支持的 o1 生成式预训练 Transformer 模型。该模型旨在处理困难任务,为科学、编码和数学领域的进步铺平道路。
在大会期间,Moonshot AI 的创始人 Kunal Zhilin 强调了 o1 模型的重要性,称其有潜力重塑各个行业并为人工智能初创企业创造新机会。Zhilin 表示,强化学习和可扩展性可能是人工智能发展的关键。他谈到了缩放定律,即具有更多训练数据的更大模型表现更好。“这种方法推动了人工智能能力的上限,”Zhilin 说,并补充说 OpenAI o1 有潜力颠覆行业并为初创企业创造新机会。
OpenAI 也强调了该模型解决复杂问题的能力,称其以类似于人类思维的方式运行。通过改进策略并从错误中学习,该模型提高了其解决问题的能力。Zhilin 表示,拥有足够计算能力的公司将不仅能够在算法方面进行创新,还能在基础人工智能模型方面进行创新。他认为这是关键的,因为人工智能工程师越来越依赖强化学习在耗尽可用的原始数据源后生成新数据。
StepFun 首席执行官 Jiang Daxin 同意 Zhilin 的观点,但表示计算能力仍然是许多初创企业面临的一大挑战,特别是由于美国的贸易限制阻碍了中国企业获得先进的半导体。“计算需求仍然很大,”Daxin 说。
百川智能的一位内部人士表示,只有一小部分中国人工智能初创企业——包括 Moonshot AI、百川智能、智谱 AI 和 MiniMax——有能力在强化学习方面进行大规模投资。这些公司被统称为“人工智能虎”,它们深入参与大型语言模型的开发,推动下一代人工智能的发展。
在大会上,阿里巴巴云还发布了多项公告,包括推出其 Qwen 2.5 模型家族,在编码和数学方面取得了进展。这些模型的参数从 5 亿到 720 亿不等,并支持约 29 种语言,包括中文、英文、法文和西班牙文。Qwen2.5-Coder 和 Qwen2.5-Math 等专业模型已经在 Hugging Face 和 ModelScope 平台上获得了一些关注,下载量超过 4000 万。
阿里巴巴云在其图片生成器 Tongyi Wanxiang 中增加了一个文本到视频模型。该模型可以创建逼真和动画风格的视频,可能在广告和电影制作中使用。阿里巴巴云还推出了 Qwen 2-VL,其视觉语言模型的最新版本。它可以处理超过 20 分钟的视频,支持基于视频的问答,并针对移动设备和机器人进行了优化。
如需了解更多关于大会的信息,请点击此处。
想从行业领导者那里了解更多关于人工智能和大数据的信息?查看在阿姆斯特丹、加利福尼亚和伦敦举行的人工智能与大数据博览会。该综合活动与其他领先活动共同举办,包括智能自动化会议、BlockX、数字化转型周和网络安全与云博览会。在此处探索其他即将举行的企业技术活动和网络研讨会。