美国教授用2岁女儿训AI模型登Science,人类幼崽头戴相机训练全新AI
一位纽约州立大学的教授为了探索更高效的AI模型训练方法,采取了一项别出心裁的实验:他将类似GoPro的相机固定在他1岁9个月大的女儿Luna头上,以此记录她日常玩耍的视角,共计11个月,每周一小时。这项研究背后的动机源自对儿童语言学习能力的观察——小孩子们能迅速吸收并理解周围环境,形成对世界的认知,其效率似乎远超现有的大语言模型(LLMs)。
当前,训练LLM需要海量数据支撑,这不仅消耗大量资源,而且模型即便在海量信息浸泡下,对于语言的掌握仍不及儿童的灵活性和创造性。纽约州立大学心理学家Brenden Lake认为,儿童学习语言的高效途径或许能为提升LLM训练效率提供灵感。于是,他和团队尝试利用儿童的真实生活视频资料来训练模型,旨在模拟儿童如何在日常互动中逐步掌握语言。
实验中,他们不仅收集了Luna的视频,还扩展到了其他25名儿童,通过这些第一人称视角的视频记录,结合照顾者的语音,模型被设计去学习视频片段与相应言语之间的联系。初步成果已发表在《Science》杂志上,展示了一个基于61小时视频训练的神经网络能够将特定词汇与视频中的情境相关联,甚至能在未经训练的情况下推断出某些对象的名称,尽管准确性有待提高。
Lake和他的团队意识到,这一研究路径与科技巨头们依赖庞大数据库训练模型的传统做法截然不同。他们追求的目标是,让AI模型能够像儿童一样,从相对有限且稀疏的数据中学习并推广,这意味着未来的LLM或许不再需要天文数字级别的数据量来训练,从而缓解数据饥渴问题。美国教授用2岁女儿训AI模型登Science,人类幼崽头戴相机训练全新AI。
尽管实验仍处于早期阶段,且面临诸多挑战,如处理视觉与语言的动态对应关系,以及模型对抽象概念理解的局限,但这些初步的成功为理解和模拟人类语言学习机制打开了一扇窗。长远来看,此类模型不仅能促进我们对人类学习和发展的深入理解,还可能应用于语言障碍治疗及儿童语言教育领域,探索更多未知的应用潜力。简而言之,这项研究尝试借鉴儿童学习的自然过程,为AI的语言学习能力开启新的探索方向。
5月14日,OpenAI在春季发布会上揭晓了其最新的旗舰AI模型——GPT-4o,这一模型以“全知全能”为目标,实现了实时的语音、文本、图像交互功能
2024-05-15 09:10:07OpenAI发布全新生成式AI模型GPT-4o近日,斯坦福大学AI团队开发的Llama3-V开源模型被指涉嫌抄袭清华大学与面壁智能合作的开源项目“小钢炮”MiniCPM-Llama3-V 2.5,此事件迅速在网络上引发了广泛讨论
2024-06-04 15:37:44斯坦福AI团队承诺撤下相关模型原标题:著名音乐人包小柏用AI技术复活女儿,为妻子唱生日歌著名音乐人包小柏的女儿包容在2021年因病去世,年仅22岁。
2024-02-29 13:08:09包小柏用AI“复活”女儿