发布时间:2022-11-21
Imagination与MulticoreWare一同在UNISOC-T710开发平台上展示了加速立体块匹配算法的性能。MulticoreWare发挥自身在OpenCL方面的专长,重新实现了立体块匹配算法,提高了计算资源的利用率和内存优化度,在Imagination GPU上实现了约50倍以上的性能提升。
MulticoreWare副总裁兼自动驾驶汽车和汽车业务部门联席总经理Vish Rajalingam表示:“高能效的GPU现在已成为所有计算机视觉、人工智能和传感应用的关键。我们十分高兴能与Imagination一起帮助他们的客户在Imagination的PowerVR GPU上实现算法优化和软件加速并规划未来添加RISC-V软件加速的路线图。”
Imagination产品管理总监Gilberto Rodriguez表示:“使用Imagination的GPU就可以在边缘设备上轻松、高效地部署计算机视觉任务以及机器学习加速。MulticoreWare正在使用我们的IP发挥其在通用GPU应用方面的真正潜力。通过与MulticoreWare合作,我们可以为客户提供经过真正优化的PowerVR部署体验。”
该立体块匹配算法是根据客户的意向进行了优化的。MulticoreWare在分析了CPU性能后确定了瓶颈,这是为了通过高效率地实现内部寄存器的使用和配置适应图像分辨率的合适全局workgroup大小来实现最大的GPU并行性。
Imagination的GM9446 GPU内存布局被用于计算自适应全局工作组的大小。除了计算方面的优化之外,算法参数也在经过修改后提高了精度,并且相比同一平台上的CPU,在GPU上实现的性能非常高。在同一配置下,CPU的时间是54.25ms,而MCW的实现时间是0.78ms,性能提高了约70倍。
热点排行