4月11日,主题为“与实俱进,为创新提速”的2023阿里云峰会在北京国家会议中心成功举办。本次活动主要围绕“大模型、AI新范式”等主题展开,吸引了近万人参会。作为AI赛道的代表企业,格灵深瞳受邀出席“AI新范式与商业创新”论坛。格灵深瞳副总裁周瑞现场发表主题演讲,分享了格灵深瞳在大模型应用实践以及行业发展趋势方面的思考。一、技术筑基,格灵深瞳致力于打造出AI“最强大脑”周瑞表示,格灵深瞳是一家技术驱动的AI产品公司,经过在人工智能领域近十年的深耕与积累,具备了机器视觉、高性能计算、大数据分析以及智能硬件的全产业链技术能力,强力赋能公司的人工智能产品及解决方案。作为公司级核心技术驱动平台,深瞳大脑在过去完成了公司4000+模型的训练迭代和跨平台优先发布以及海量数据的管理、清洗、预处理等工作。目前,深瞳大脑可支持数十亿训练数据、数亿类别任务、数十亿参数模型的训练。训练平台生产高质量的算法,推动应用的落地,数据平台收集应用产生的高质量数据又促进算法的提升,从而算法、应用、数据在深瞳大脑系统内形成人工智能的正向循环,为公司的高效研发创新与产业应用提供了有力支持。当前,深瞳大脑持续托管公司多个预训练模型。周瑞透露,今年公司在深瞳大脑基础上完成了AI开发平台的迭代,新的迭代平台覆盖了从数据预处理、算法训练、模型部署到模型推理的整个AI生命周期,支持以更高效的方式服务下游业务,加速AI落地速度。未来,格灵深瞳将持续加大技术驱动平台的创新与研发,以更加先进的技术驱动各业务创新落地,致力于提供领域级的通用视觉人工智能,打造格灵深瞳的AI“最强大脑”。二、AI+交互,两大创新业务加速落地作为国内人工智能行业的先行者和引领者,格灵深瞳近十年在深耕技术的同时,也在场景应用方面不断发力。目前格灵深瞳在智慧金融、城市管理、商业零售、轨交运维、体育健康、元宇宙六大领域进行了AI应用的探索和实践。其中,在AI+交互层面,周瑞分享了格灵深瞳在沉浸式交互体验和智慧校园体育这两大新兴AI应用场景的前瞻性布局和最新进展。在沉浸式交互体验方面,格灵深瞳自研的大规模沉浸式人机交互系统基于业界领先的3D立体视觉技术,具备空间沉浸感、真人互动、内容一键下发/切换以及丰富的人机交互方式等特点,该系统可提供在大场景中的人体动作姿态感知、六自由度装备感知等能力,主要应用领域包括展览展陈、文博旅游、游戏、少儿科普等,为元宇宙和人机交互的应用落地提供了新的想象空间。当前,大规模沉浸式人机交互系统已完成前期的阶段性研发工作,并在去年的北京服贸会上首次对外展示。对于这种新形态的交互体验,现场观众和媒体都给出了非常高的评价,等待体验的观众一度排起了长龙。在智慧校园体育方面,针对当前“双减”政策的实施以及素质教育的要求,格灵深瞳面向中小学提供了智慧校园体育解决方案,助力学校智慧教学,帮助学生科学锻炼。格灵深瞳基于高精度运动捕捉和人体姿态识别算法,具备基于实时视频、历史视频的人体运动结构化、姿态分析、动作规则评判等能力,可以满足运动训练场景下的智能运动评价、实时运动风险预警、个性化运动指导等多种业务应用需求。该业务在助力学校分层教学,构建基于人工智能的智慧体育新型教学模式方面发挥了重要示范作用。周瑞表示,该业务模式已在全国多个校园进行试点,为20000多名在校生及教师提供日常教学支持与考试服务。三、AI大模型浪潮下,格灵深瞳的预训练模型技术范式思考当前,AI大模型浪潮已至,在当天主论坛现场,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示:“面对AI时代,所有产品都值得用大模型重做一次。”AI大模型时代,算力、算法、数据仍然是AI大模型研发的三大要素。周瑞在现场也基于格灵深瞳在预训练模型方面的实践,分享了格灵深瞳的洞察与思考。要更高效地进行模型算法的敏捷开发依托深瞳大脑,格灵深瞳已经构建了计算机视觉领域基于数据驱动的AI生产平台。面向未来,我们将尽可能借助领域通用AI模型的强大能力,赋能公司内部的算法和应用开发,用通用抽象的方法去解决长尾的碎片化问题。要用全新的方式定义人机交互方式拥有理解能力的人工智能模型的发展,决定了人与机器的交互会进入一个全新的时代,由人编写规则与逻辑,让机器执行的传统方式会被颠覆,探索出更好的与AI协同工作的复杂系统具有重要的现实意义。要持续的提升AI计算能力AI计算性能的提升不单是简单的算力堆叠,还要做大量的优化工作。随着大模型范式的兴起,如何更高效利用算力完成训练,并在推理端提供实时可靠的服务,是AI公司要长期考虑的问题。演讲结束后,周瑞还受邀参与圆桌论坛环节,与其他行业嘉宾共同探讨AI新范式下的商业创新。周瑞表示,当前AI迎来一波新浪潮,并带来了革命性的交互改变,这是非常振奋人心的事情,对AI行业而言,更要将服务做到极致,借助大模型的归纳理解能力做出具有全新交互体验的产品。针对垂直场景训练自己模型的必要性问题,周瑞认为,垂直领域要不要做自己的模型,最终还需要看是否有足够的跨模态的数据去支撑。当前,AI大模型呈现百花齐放态势,驱动AI技术释放更多潜力。未来,格灵深瞳将继续构建数据、场景、软硬一体技术能力等多重核心竞争力,以技术创新驱动业务落地和产业创新,让AI真正造福人类。 |