因此,可以认为ACCEL的时钟频率是500M,也就是一个时钟周期2纳秒。等于是说,几个时钟周期,ACCEL就把计算任务办完了。而在传统计算机里,无论是CPU还是GPU,这类计算任务都要很多个时钟周期的,做个乘法就要好多步。并行是说,海量数据可以组成向量加速,但对某个数据处理的时钟周期是省不了的。
所以清华论文报告说,在进行ImageNet三类物体分类时,ACCEL的计算速度约相当于4550个TOPS。TOPS是Tera Operations Per Second,代表每秒1万亿次操作。这个计算速度确实能有商用GPU的3000多倍,因为GPU每秒能有1万亿次操作已经很好了。所谓“算力是商用GPU的3000多倍”,就是这么来的。但这个说法,究竟是哪里不对呢?
真正的问题,在于持续计算。ACCEL确实能在几纳秒之内处理一幅图像的光信号,但它能不能持续运算,真的用一秒时间,完成4550TOPS的运算量?这就不行了,因为准备任务是需要时间的。例如以它的计算速度,一秒能处理1亿个图片,但把这么多图片的光信号在一秒内发送给它,是不可能的。实际准备一个图片需要的时间就不短,真正的瓶颈是在这儿。
ACCEL芯片测试准备
ACCEL芯片是一个光电芯片,它的输入是光信号,要把它运行起来,需要准备好光信号输入,而这是个相当复杂的任务。按论文描述,清华团队要搭起光学镜片组,才能将识别目标的光信号输入给ACCEL进行处理,换下一个识别目标要不少操作。而GPU、CPU在计算机系统中应用多年了,处理输入已经很成熟了,所以能将海量数据组织起来,象流水线一样送到运算核心不停处理。高性能GPU的核心技术之一,就是海量数据输入管理,要用到上百G的高速存储器,多级缓存。
所以,论总的算力ACCEL并不大,它只是对整个流程中的一步处理得极快,而这一步快的代价是另一些步骤慢。一个比喻是,一个士兵面前正好有一个敌人,他开枪只用1秒钟就消灭了一个敌人。但这不代表他可以一小时消灭3600个敌人,更不是说他可以一个人顶3000多个人。如果有人说他的“战力”有3000多个士兵这么多,这就错得离谱。再一个比喻是,一张弓,可以在1秒内让箭飞出100米,速度很快。但是,不能说它的“运送能力”是1小时360公里,因为没法持续飞。如果射一箭,人走过去再射一箭,这样接力,一小时跑不了多远。
【三大指数集体低开 创业板指跌近1%】沪指低开0.66%,深成指低开0.86%,创业板指低开0.97%,算力芯片、智慧灯杆、通感一体化等板块指数跌幅居前
2024-08-02 13:07:29三大指数集体低开在9月10日的凌晨1点,苹果的发布会拉开了帷幕。发布会上,苹果揭晓了其最新的A18芯片,这款芯片采用了先进的3纳米工艺制造,将首次装载于iPhone16系列之中
2024-09-10 08:50:04苹果A18芯片发布:CPU提升30%12月14日,2024科学家创新大会在雄安召开。会上,多位院士专家讨论了遥感产业的未来发展,认为推动算力“上天”将成为产业未来发展的大趋势
2024-12-17 02:16:45我国将构建天地一体化算力网络2024中国算力大会将于9月27日至29日在河南郑州举行,华为将参与此次大会,主题定为“共赢算力新时代”
2024-09-25 09:12:00华为将参加2024中国算力大会