新闻
当前位置:新闻 > 聚焦 > 正文

京东云斩获两项AI大奖,以数智技术推动产业数字化发展(2)

京东云AI团队作为多模态内容理解的早期推动者,在视觉与语言、多模态内容交互领域完成多项前沿创新。在视觉与语言方面,围绕跨模态自洽、交互到共生的研究脉络打造了一系列视觉与语言的代表性工作(LSTM-A [1],GCN-LSTM [2],HIP [3],X-LAN [4],COS-Net [5]),在计算机视觉和多媒体领域国际顶级会议和刊物上发表论文十余篇,并开源了业界首个模块化、标准化的多模态视觉内容分析平台X-modaler [6],获ACM Multimedia 2021最佳开源项目奖。在多模态内容交互方面,依靠多项原创成果(ViCo [7], Tree-Block [8], SPT [9]),团队积累了完备的多模态实时内容交互技术,研究成果ViDA-MAN [10]获得ACM Multimedia 2021最佳演示论文奖,同时在聆听态数字人、演讲数字人等前沿领域组织国际竞赛持续增强影响力。此次京东云凭借“多模态视觉内容分析”技术,在中国多媒体大会(ChinaMM)上荣获全国十佳企业创新技术奖,再次印证了京东云在该领域的创新性和前瞻性。

此外,京东云凭借“Transforming Online Shopping Experience with Multimedia Computing”技术,在国际多媒体学会会议(IEEE ICME)上,获得多媒体创新引领者奖(Multimedia Star Innovator)。该奖项由国际多媒体大会IEEE ICME颁发,每年在国际范围内仅遴选一个引领多媒体技术的创新团队。京东作为本年度唯一获奖者,体现了其深耕零售领域的多媒体技术深度,也展示了在多媒体领域的技术影响力。

以京东云数字人技术为例,目前京东数字人主播已在零售场景中广泛应用,覆盖3C、家电、母婴等类型的京东自营店铺。在AI技术的驱动下,京东云数字人主播能够结合商品的不同功能,配合打招呼、双手摊开、握拳、点赞等丰富多样的动作。在京东云数字人主播的推荐下,消费者可以更直观、详实地了解商品信息,商家仅需一次性导入商品功能,就可以将这些信息转化为可感知的视频内容,并在直播间中介绍商品、智能地回答观众问题,7×24小时不间断直播卖货。