谷歌DeepMind团队于5月27日宣布推出SignGemma,这是其迄今为止最强大的手语翻译模型,能够将手语转化为口语文本。该开源模型计划在今年晚些时候加入Gemma模型家族。SignGemma支持多语言功能,但目前主要针对美国手语(ASL)和英语进行了深度优化,开发者可以自由使用并改进它。
DeepMind希望通过这项技术帮助手语使用者克服沟通障碍,在工作、学习和社交中更加顺畅地参与。今年,DeepMind还推出了Gemma 3n模型,可以从音频、图像、视频及文本输入生成智能文本,助力开发者打造实时互动应用。
谷歌与佐治亚理工学院及Wild Dolphin Project合作,基于巴哈马大西洋斑点海豚的长期研究数据构建了DolphinGemma模型,用于分析并生成海豚声音。此外,MedGemma模型作为Gemma 3家族的新成员,专注于医疗AI领域,支持临床推理和医学影像分析,推动医疗与人工智能的融合创新。
美国搜索引擎和AI巨头谷歌公司周三宣布产品线全面上新,所有用户正式迈入“Gemini 2.0”时代。其中,Gemini 2.0 Flash模型上线,这款模型适用于大规模、高容量、高频率任务
2025-02-07 07:51:07谷歌更新多款Gemini2昨晚,科技圈再次沸腾。谷歌 DeepMind 发布了历时一年半研发的 AlphaEvolve,这是一个由 Gemini 驱动的 AI 智能体,能够自我进化并解决复杂问题
2025-05-18 15:44:37谷歌超强AIAgent登场中国人工智能企业DeepSeek近日发布最新开源模型,引发广泛关注。谷歌首席执行官孙达尔·皮柴在迪拜举行的世界政府峰会上表示,DeepSeek在展示AI的全球化程度方面表现出色
2025-02-15 00:11:56谷歌CEO