加速推进应用落地，现在开始流行把大模型做“小”了？

作者：陈炳欣 2024-07-05

来源：爱集微 #AI# #大模型# #周鸿祎# #算力# #OpenAI#

7.1w

近年来，在OpenAI、谷歌等国际巨头的推动下，大模型不断朝着万亿、十万亿参数发展。但是这也带来了算力、数据、能源等诸多方面的挑战。因此，在近日召开的“2024全球数字经济大会人工智能专题论坛”上，多位业界嘉宾都提出，“大模型越做越大并非唯一选择”，“逆向思考，模型将朝轻量化发展”，“寻找‘明星场景’，加速推进应用落地”等发展思路。拥抱专业化，加速应用落地，赋能千行百业，或许才是突破瓶颈，将大模型技术推向新高度的有效路径。

越做越大并非唯一选择

从ChatGPT到Sora，AI大模型从去年火到了今年。日前有消息称，OpenAI将于2025年发布GPT5.0，智能化水平进一步提高，参数超过10万亿级别。英伟达也凭借新一代BlackWell架构GPU，市值一度超过苹果、微软。有观点认为，大模型为代表的人工智能技术，或将掀起新一轮的工业革命。与此同时，大模型也面临诸多挑战，包括算力、算法、能耗问题等，下一步的发展路径成为业界热议的焦点。

360集团创始人兼董事长周鸿祎在“人工智能专题论坛”演讲中就表示：“如何才能引发工业革命呢？我有一个观点，要把大模型‘拉下神坛’。”周鸿祎强调，超级电脑并没有引发工业革命。是个人电脑走入千家万户、百行千业，才带来了信息革命。现在，提大模型言必称OpenAI，OpenAI的确很伟大，为人类探索出了超级通用人工智能之路，但这条路要靠卷模型、卷算力、卷数据，将模型向着万亿参数发展。OpenAI是试图创造一个像神一样的超级人工智能，认为全世界所有的企业、个人、政府只用他们一家做的服务就够了。但是这个逻辑上并不成立。

事实上，大模型猛然一用感觉很惊艳，说话头头是道，但是一旦下沉到各专业领域，就会发现它不仅缺乏行业深度，对具体的业务更是一窍不通。因为通用大模型都是用互联网公开数据训练的。因此，周鸿祎认为，我们不能被OpenAI牵着鼻子走，超级通用人工智能应该在国家牵头下，发挥新型举国体制优势，在开源的基础上分工合作形成合力，最终实现技术的突破。对于企业来说，应当换一种思路，逆向思考，大模型越做越大并非唯一选择。

面壁智能联合创始人兼CEO 李大海也指出，现在端侧AI已经成为全球发展趋势。端侧模型拥有云端模型所不具备的比较优势：首先是端侧模型具有更强的可靠性。模型部署在终端可以实时、连续地与环境进行互动，云端模型却很难保持这种连续性。其次是端侧模型能够更好地保证用户隐私。这个问题已经引起人们越来越高的重视，未来如果机器人广泛进入家庭，隐私问题将变得更加严重。端侧模型在保障数据隐私方面的优势更加明显。此外，有统计数据显示，全国保有的10亿部以上手机，集合总算力可达7100EOPS，相当于100万块H100的算力。如果有效应用这些算力，可以支撑大量应用场景的落地。

“明星场景”决定产业成败

在模型不再一味求“大”的情况下，寻找适合的“明星场景”成为决定产业成败的关键问题。因为大模型只是能力，不是产品，能力结合场景才能真正地发挥作用。

AI PC作为端侧智能的重要载体，正在逐步改变我们的工作和生活方式。联想集团副总裁范建平在论坛上分享了联想AI PC的最新进展，展示了端侧大模型在PC端的应用潜力。通过压缩大模型、优化推理性能等手段，联想AI PC实现了在有限算力下的高效运行，为用户提供了更加智能、便捷的使用体验。

AI PC不仅能够实现语音识别、自然语言处理等基本功能，还能通过智能推荐、个性化设置等高级功能，提升用户的工作效率和生活品质。未来，随着端侧算力的不断提升和大模型技术的持续进步，AI PC有望在更多领域实现应用落地，成为推动智能化转型的重要力量。

智能汽车作为人工智能的重要应用领域之一，正在引领汽车行业的深刻变革。理想汽车智能空间副总裁勾晓菲在论坛上分享了大模型在智能座舱中的应用与发展趋势。通过大模型上车，智能汽车实现了更加自然、流畅的人机交互体验，为用户提供了更加丰富、个性化的服务。

自动驾驶作为智能汽车的核心功能之一，也在大模型的加持下不断取得突破。大模型通过深度学习和强化学习等技术手段，不断提升自动驾驶系统的感知、决策和控制能力，使其能够在复杂多变的交通环境中实现安全、高效地行驶。未来，随着大模型技术的不断成熟和应用场景的不断拓展，智能汽车有望成为推动交通出行领域智能化转型的重要力量。

医疗领域作为人工智能的重要应用场景之一，正在通过大模型技术实现精准医疗的新突破。百川智能CEO王小川介绍了公司在医疗领域的布局思路，强调医疗是大模型皇冠上的明珠，将是AI应用最重要领域之一，可以发挥AI的最大潜力。深势科技创始人兼CEO孙伟杰在论坛上分享了AI for Science大模型在微尺度工业研发中的应用案例，其中就包括了医疗领域。

通过大模型技术，医疗机构可以实现对海量医疗数据的深度挖掘和分析，发现潜在的疾病标志物和药物靶点，为精准医疗提供有力支持。同时，大模型还可以应用于智能诊断、个性化治疗方案设计等领域，提高医疗服务的效率和质量。未来，随着大模型技术的不断发展和医疗数据的不断积累，人工智能有望在医疗领域实现更加广泛的应用落地，为人类的健康事业做出更大贡献。

芯片性能不等于智算集群性能

算力作为人工智能发展的基石，对于大模型技术的落地应用同样至关重要。阿里云副总裁安筱鹏在论坛上分享了智算集群的三个不等式，强调了高性能算力对于大模型训练的重要性。他指出，芯片性能不等于智算集群的性能，自主可控不等于技术封闭，技术可用不等于商业可行。因此，在推动人工智能应用落地的过程中，必须充分考虑算力的问题，加强算力基础设施的建设和优化。

当前，算力发展面临着诸多挑战。一方面，随着大模型参数的不断增加和训练任务的日益复杂，对算力的需求呈现指数级增长；另一方面，算力资源的分布不均和利用率低下等问题也制约了算力的发展。然而，算力发展也面临着诸多机遇。随着云计算、边缘计算等技术的不断成熟和应用场景的不断拓展，算力资源将实现更加高效、灵活地配置和利用。同时，随着国产芯片技术的不断突破和生态建设的不断完善，国产算力资源也将逐步取代进口算力资源，为人工智能的自主可控发展提供有力保障。

安筱鹏认为，从算力体系建设上来说有三个核心要素：一是如何构建一个技术先进的体系，能够满足更高参数的训练，从万卡到超万卡的技术体系是今天模型发展的、持续不断探讨的课题。二是我们需要探索构建一个生态开放的，能够兼容各种技术体系和框架的生态。三是要探讨商业上可行的技术路径，探索构建一个可回报商业模式，实现算力基础设施从“能用”，到“好用”，到“普惠”，到“易用”，到“人人可用”的商业基础设施。

人工智能作为新一轮科技革命和产业变革的核心驱动力，正在以前所未有的速度改变着我们的世界。通过加速应用落地，人工智能将赋能千行百业，推动产业升级和转型，满足市场需求和用户期望，促进科技创新和社会进步。在这个过程中，算力作为人工智能发展的基石，将发挥至关重要的作用。未来，随着算力技术的不断发展和应用场景的不断拓展，人工智能必将在更多领域实现广泛应用落地，为人类的未来生活创造更加美好的可能性。