FPGA+CPU可让数据中心的图像处理性能大幅提升

2020-03-06来源: EEWORLD关键字:FPGA

图片逐渐成为互联网主要的内容构成,相应的图片处理需求也在高速成长,移动应用与用户生产内容(UGC)正在驱动数据中心图像处理的业务负载快速增加。本文深维科技联合创始人兼CEO樊平详细剖析了图片加速的必要性、当前实际的图片解决方案与部署方式以及如何通过FPGA+CPU异构计算的方案维护用户体验与服务成本新平衡。

 

  1. 1.为什么需要图片加速?

 

 

目前,图片处理的需求正在快速成长,即源于用户生成内容,视频图片抓取等方式的图片缩略图生成,像素处理,图片转码、智能分析处理需求不断增加。众多应用迫切需要高性能,高性价比的图片处理解决方案。

 

 

在这种情况下,数据中心面临着一个核心的考验--即用户体验与服务成本之间的平衡。总地来说,目前存在的纯CPU处理方案,TCO(服务器、电费、带宽、场地人员 成本)相对高昂,用户体验也相对较差。

 

2 . 解决方案

 

2.1. ThunderImage JPEG2JPEG缩略图方案

 

鉴于此,深维科技推出了基于FPGA+CPU异构计算的解决方案-JPEG2JPEG,通过高性能FPGA分担CPU处理任务,其所带来的优势是20倍吞吐性能提升,20倍延迟的降低,5倍实际成本的节省以及10倍的能效比提升。

 

 

JPEG2JPEG缩略图方案是将用户上传的图片进行高质量的缩放,即可满足绝大多数应用场合需求,例如,微信接收的一般都是缩小后的图片。缩略图是一项大量的、高并发的需求,针对4K图像输入,输出缩放至1024x768、640x480的场景。目前,JPEG2JPEG缩略图方案可以实现吞吐量550张、延迟约58ms的高性能效果。

 

2.2 . ThunderImage JPEG2WebP转码方案

 

 

WebP的需求主要来自于对带宽成本的节省。WebP相较于JPEG,在同等图像质量情况下,压缩率可以提升25%~34%,相应的对带宽成本的节省更加明显,并且因为传输数据量的减少,延迟也会随之降低,进而带来用户体验的提升。但与此同时,WebP也存在一项问题,其计算复杂度是JPEG的10倍,对服务器的性能要求也更高,进而造成部署成本的提升。

 

 

深维科技的ThunderImage JPEG2WebP转码方案,通过FPGA加速带来10倍左右的性能提升,进而降低WebP的复杂度及服务器成本。ThunderImage JPEG2WebP转码方案支持Baseline、Main、Ultra几种类型,实现了对WebP M4以及M6模式的支持,并且支持了M4的比特级一致(与CPU参考软件输出结果每比特一致)。


关键字:FPGA 编辑:muyan 引用地址:http://news.nvwayi.com/FPGA/ic490701.html 本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:MathWorks在 FPGA 和ASIC上实现自动化视觉系统设计
下一篇:最后一页

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

高云半导体的蓝牙FPGA模组获得欧盟CE认证
中国广州-全球增长最快的可编程逻辑公司广东高云半导体科技股份有限公司(以下简称“高云半导体”)的BLE(Bluetooth Low Energy Radio)模块获得欧盟的CE-RED(全称Radio Equipment Directive)认证,使开发人员可以快速轻松地将GW1NRF-4 µSoC FPGA BLE模块整合到最终产品中。   2019年年底,高云半导体发布了首款带有集成BLE模块)的GW1NRF-4 FPGA,该器件提供4.6k LUTs,内部集成一个32位低功耗的ARC处理器和一个蓝牙BLE模块,封装为6x6mm的 QFN。为了给客户提供更完善的解决方案
发表于 2020-04-07
高云半导体的蓝牙FPGA模组获得欧盟CE认证
基于FPGA的虚拟DPO设计方案
内也不能捕捉波形信息。而DPO的数据采集和显示模块并行运行,使得DPO能够在处理显示数据的同时,继续采集信号数据。同时,与DSO不同的是,DPO是在连续进行多次采集与处理后再进行一次显示。由于DPO一般采用专用硬件电路进行采集波形的数字荧光处理,不再受限于微处理器对数据的低速处理,使得波形的更新率有了质的提高。所以DPO能够连续不断得捕捉波形的绝大部分细节,可以完整的反映波形信息,同时也为后续的分析处理提供了完整的数据。如图2所示。数字荧光显示技术的应用使DPO能以不同的亮度或色彩显示信号在某一特定位置出现的频率,频率越高,则亮度越高。数字荧光处理器一般由专用的硬件电路(高速FPGA或ASIC)构成。与DSO一样,输入信号首先经放大
发表于 2020-04-05
基于FPGA的虚拟DPO设计方案
瑞萨全新PMIC参考设计加速FPGA和SoC产品问市
全球领先的半导体解决方案供应商瑞萨电子株式会社宣布推出三款易于使用的电源管理IC(PMIC)参考设计,用于为Xilinx Artix-7、Spartan-7系列FPGA以及Zynq-7000 SoC的多个电源轨供电,并可选配DDR存储器。瑞萨与Xilinx紧密合作,提供低风险且易于开发的电源解决方案,以加速FPGA和SoC设计。该参考设计可加快各种工业及运算类应用的电源研发速度,其中包括电机控制、机器视觉摄像头、可编程逻辑控制器(PLC)、家庭网关与家电、便携式医疗和无线设备等。 瑞萨高效PMIC参考设计提供了用户友好的交钥匙解决方案,使单个设计能够支持不同的Xilinx速度等级和DDR存储器类型,包括DDR3
发表于 2020-03-25
瑞萨全新PMIC参考设计加速FPGA和SoC产品问市
ARM与FPGA沟通的桥梁—米尔PYNQ开发板
前言:PYNQ全称为Python Productivity for Zynq,即在Zynq全可编程ARM&FPGA融合处理架构的基础上,添加了对Python的支持。 PYNQ希望能够借助Python语言本身易用易学、扩展库多而全、社区活跃贡献度高等特性,有效降低Zynq嵌入式系统的开发门槛,并为人工智能,ADAS,机器视觉等高拓展性/高复杂度应用需求提供更好支撑。PYNQ将ARM处理器与FPGA器件的底层交互逻辑完全封装起来,顶层封装使用python,只需要import对应的模块名称即可导入对应的硬件模块,即可进行底层到上层数据的交互或者为系统提供硬件加速。  PYNQ突出优点在于:可直接调用
发表于 2020-03-25
ARM与FPGA沟通的桥梁—米尔PYNQ开发板
Zebra软件平台让FPGA深度学习推理不再复杂
全球领先的技术解决方案提供商安富利亚洲和AI软件领域的创新企业Mipsology宣布,安富利将向其亚太区客户推广和销售Mipsology的Zebra软件平台。Zebra消除了FPGA的技术复杂性,使得它们可以即插即用,并发挥超快的速度和出色的性能。该协议扩展了安富利的物联网生态系统,为安富利的亚洲客户带来了Mipsology突破性的深度学习推理加速解决方案。希望部署人工智能的企业,现在无需修改代码,便可以无缝迁移到全新的基于FPGA的加速技术。而且,与基于GPU的解决方案相比,其软件和硬件的使用寿命要长得多。 安富利首款采用该解决方案的产品,将是基于Zebra的赛灵思Alveo数据中心加速器卡。未来产品的范围有望扩大
发表于 2020-03-25
AI/ML促使FPGA和ASIC走到了一起
翻译自——Semiwiki 随着人工智能、机器学习等应用场景快速发展演进,对芯片的算力、安全性等性能也提出了更高的诉求。据市场调研公司Semico Research数据显示,2018年FPGA市值约为10亿美元,在未来4年内,人工智能应用中FPGA的市场规模将增长3倍,达到52亿美元。要知道,这个增长是非常惊人的,毕竟过去多年,FPGA市场的年均增长率也才8%-9%。目前人工智能、机器学习等应用场景的FPGA市场约为25%,预计两年后将达到72%。如此庞大的市场空间,则需要性能更高、更加灵活的AI 算法解决方案。   关于块浮点数(BFP)已经出现一段时间了,但是现在才开
发表于 2020-03-25
AI/ML促使FPGA和ASIC走到了一起
小广播
夏宇闻老师专栏

你问我答FPGA设计

北京航空航天大学教授,国内最早从事复杂数字逻辑和嵌入式系统设计的专家。

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2020 nvwayi.com, Inc. All rights reserved
真人百家乐送彩金 可以提现送彩金的捕鱼游戏 购彩票送彩金 送彩金棋牌平台大全 吉林快三机器人 澳客彩票代理 送彩金的博彩公司 充话费送彩金 免费送彩金棋牌游戏 棋牌送彩金且可提现的网站