新闻
当前位置:新闻 > 聚焦 > 正文

专访李兵:他坚守的跨模态视频搜索正在爆发(3)

真正进入创业,则是一出“千里马遇见伯乐”的故事。

2019年,计划布局内容科技的人民网,与想做科技成果转化的中科院,一拍即合,世界领先的视频理解技术启动了产业化的征程。

成为创业者

2020年,人民中科正式启动运营。

这样一家颇具传奇色彩的初创公司,带着央媒龙头和中科院的基因,以攻坚下一代内容认知能力为使命,在各方瞩目下,就此扬帆起航。

去年11月,人民中科核心产品“白泽”正式上线,这是成立仅两年时间的人民中科交出的第一份答卷。

“白泽”的典故出自于中国神话《山海经》中一种“通万物之情、晓万物状貌”的神兽,它知道天下所有鬼怪的名字、形貌和驱除的法术。这是一款跨模态视频搜索引擎,将文字、图片、语音和视频等不同模态信息映射到一个统一特征表示空间,以视频为核心,学习多个模态间统一的距离度量,跨越文字、语音、视频等多模态内容的语义鸿沟,自动关联多模态间关键要素。

“白泽”无疑是跨模态视频搜索引擎的先行者。但对李兵来说,这是一个长期坐“冷板凳”的厚积薄发的过程。

在图文为主的互联网时代,视频内容安全鲜有人关注,一方面是视频内容数量不多,互联网场景也一直都不如安防、工业等领域受欢迎,另一方面,类似色情、暴恐这样的敏感内容,在学术界关注度较低。李兵和研究团队在恩师胡卫明研究员的带领下,率先将色情、恐怖图像/视频的识别相关研究成果发表在顶级学术期刊上。

但李兵一直在坚持,用他的话说,无论是读书还是工作,自己总希望能在一个细分领域里做到最好。团队在视频内容理解领域坚持了二十余年后,他也终于等到这个赛道的全面爆发。