首页/文章/ 详情

新的AI时代需要新架构:Tensilica Vision Q6

2小时前浏览2


           

Paul Mclellan

特别邀请Cadence资深博主Paul Mclellan分享关于Cadence热门技术和产品信息。

Paul曾任Cadence全球副总裁

 

视觉应用与人工智能(AI)正朝着精细化的方向发展,其背后的多种推动力中,最重要的两种是高端智能手机的先进功能以及ADAS(高级驾驶辅助系统)/自动驾驶技术。


智能手机的面部识别功能需要同时调用视觉与AI处理两种技术,而且技术难度不断增加。最难的部分在于非理想状态下的面部识别,如侧脸、戴帽子、部分脸被围巾遮盖等。为此,智能手机的摄像头变得越来越精细,采用多种传感器实现高动态范围图像(HDR)、双摄变焦、图像稳定等功能。


第二个推动力,即ADAS,它的设计需要满足两大需求。第一个是面向特定功能的性能要求,比如行人侦测、驾驶员注意力监控、道路偏离预警;第二个是降低功耗。大多数芯片都安装在空气流通较差的环境(没有风扇),甚至极端温度环境,如前挡风玻璃上后视镜的背面。


还有一些其他驱动因素,如虚拟现实、增强现实、机器人、无人机、监控摄像头等技术的发展,它们的需求与上述场景大同小异。


上述功能、视觉和AI技术通常被集成到单独的摄像头管道,从降噪、视觉后处理等任务开始,再到图像分类和分割。有时候,AI需要先完成场景分类,然后再执行HDR或Bokeh焦外成像(模糊处理在日语里被称作 boke)等精细图像处理任务。


总体看来,目前有以下三种技术需求:

  • 将视觉和AI处理集成在单一DSP

  • 提升性能

  • 极低功耗的限制

为了满足这三种技术需求,新一代Tensilica Vision处理器应运而生。


全新Tensilica Vision Q6简介

提高性能,我们考虑了下面几套可选方案:

  1. 增加SIMD宽度或VLIW槽的数量。但是这样会增加编程难度,因为很多闲散资源无法有效利用。简单地增加算力比有效地利用算力要简单。

  2. 多核。可以立马将可用处理能力提高一倍(或更多),但是需要两倍的本地内存,而且很难做到每个核计算负载的平衡

  3. 升频。显而易见的提高性能的方法,但代价是面积(成本)和功耗的增加

  4. 打造更高性能的新架构

Cadence决定采取第四种方案。全新Vision Q6 DSP是第五代产品,面向视觉和AI 应用量身打造,采用13级流水线,16nm工艺下可实现1.5GHz处理器频率。较上一代P5,相同版图面积条件下的频率提升达50%。峰值性能的效率提高1.25倍。采用标准图像处理内核时,性能提升可达2倍。


流水线构成如下:

  • 指令前端(3级)

  • 指令解码与分派(2级)

  • AR/标量整数管道(5标量寄存器/标量流水线)

  • 矢量DSP(3级)


读取和写入会在指令解码一级完成后分别进行。同时,矢量执行和标量执行也分开进行,这样可以提高标量性能,并提供了增加标量cache的机会。该cache可以提高标量处理能力50%,而且存储器速度越慢,cache优势就越明显(与没有cache的情况相比)。


Q6的另一个新特色是添加了一个分支预测。流水线越深,这个功能就越重要,因为一旦错过就必须清空并重新填充流水线。


Q6与P6向上兼容,为P6写的任何代码都可以无需修改在Q6上运行。但是Q6有一些新指令无法在P6上运行。

凭借AXI4互联技术,Q6可以在多处理器环境中运行。用户不仅可以使用多个Q6 核,在VQ6的系统中增加VisionC5来分担AI的处理。

 

Q6编程

在芯片上设计一大堆高性能处理资源是很容易的,但程序员可能最终无法从高层软件开发中获得这些处理资源。AI采用多种框架,Q6可以实现以下功能:

  • 安卓神经网络:在安卓平台(即非苹果智能机)上实现本地AI应用

  • TensorFlow、TensorFlow Lite、Caffe

  • 定制层支持:用户可以在标准网络基础上自行添加特殊功能

  • 支持多种标准神经网络(MobileNet、Inception、Resnet、VGG、Segnet、FCN、YOLO、RCNN、SSD等)


安卓神经网络(ANN)相对比较新,去年10月刚刚发布,到现在也就半年的时间。ANN提供的神经网络API可以让开发者无需关注具体AI处理是在应用处理器(通常是高端ARM处理器)还是在专有的AI DSP上执行。。Q6支持运行在安卓8.1系统(Oreo)的ANN,可实现实时的优化执行。右图显示的是ANN各组件的协作方式。作为专用处理器(也可称DSP,术语不同而已)的Q6位于流程的中心。

上图中显示的是现有Tensilica AI工具链,也称为XNNC(Xtensa神经网络编译器)。该工具链需要一个神经网络描述符(在Caffe或Tensorflow框架下)将其编译成可以在Q6(或P6、C5)上运行的代码。它可以自动处理许多管理工作,如DMA和tile管理。Tensilica AI处理技术采用8位定点权重,但经过几年的发展,32位浮点和8位定点也能实现同样的精度了(约0.5%量子化误差),其好处就是可以节省大量的功耗和面积。


对于HDR、语音身份认证、图像稳定等特殊算法,Cadence正与相关领域的合作伙伴展开广泛合作。我们还是Khronos公司OpenVX工作组的负责人,推动视觉处理分流标准的开发。

来源:Cadence楷登
汽车芯片自动驾驶机器人Cadence人工智能无人机FASTUnity管道
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-09-27
最近编辑:2小时前
Cadence楷登
签名征集中
获赞 0粉丝 86文章 233课程 0
点赞
收藏
作者推荐

推出首款通过硅验证的长距离7nm 112G SerDes IP,加速建设新一代云数据中心基础设施

多速率PAM-4 SerDes具备行业领先的PPA能效中国上海,2018年11月8日 – 楷登电子(美国Cadence公司,NASDAQ:CDNS)今日发布业内首款通过硅验证的长距离7nm 112G SerDes IP。基于TSMC 7nm制程的Cadence® 112G PAM-4 SerDes IP拥有业内领先的功耗、性能与面积(PPA)能效,助力开发新一代云计算规模的高端口密度网络产品和电信数据中心。对这项创新技术表示出强烈兴趣的早期用户已与Cadence展开密切合作。Cadence正与更多客户开展合作,助其开发下一代高性能计算(HPC)ASIC、机器学习加速芯片,网络交换SoC。如需了解更多详情,请访问www.cadence.com/go/112gserdes。 移动数据消费的升级,人工智能、机器学习的应用以及5G通信的发展都依赖于不断增加的带宽,对现有的云数据中心服务器、存储和网络基础设施造成了巨大压力。目前,高端云数据中心的早期用户正在装配400G以太网端口,并有望在2020年成为主流技术;而800G以太网端口将成为届时的新技术。112G SerDes技术的数据速率是56G SerDes的两倍,因此可以满足机器学习和神经网络等新兴数据密集型应用的爆炸式高速连接需求。基于Cadence 2017年收购nusemi公司获得的技术,新发布的长距离112G SerDes可以支持背板、铜和光学连接。产品的主要特色包括:独有的底层软件控制自适应功耗设计,可根据平台需求实现最佳的功耗与性能平衡以及更高效的系统设计基于DSP的架构针对有损耗的、嘈杂的信道提供卓越的数据恢复能力长距离技术让客户得以使用成本更低的PCB,并在PCB和系统的设计时灵活性更强包括112/56Gbps脉冲调幅4(PAM-4)和56/28/10Gbps不归零制(NRZ)数据速率在内的多速率支持,向下兼容运行速度更低的旧型设备支持全自动启动与自适应,集成内置自测试(BIST),可生成并检查伪随机二进制脉冲序列(PRBS),增强IP的使用便捷性“112G SerDes是一项全新的关键辅助技术,可以帮助行业以更快的速度和更低的成本打造下一代100、400和800Gb 以太网云基础设施,”Cadence公司首席执行官陈立武表示。“我们已经过硅验证的112G长距离多速率SerDes使Cadence成为了高性能计算系统设计辅助技术的领先供应商。Cadence的解决方案可提供每线100Gb/秒的运算速度,减少线数、散热和成本,助力下一代超大规模数据基础设施的建设。”技术可用性早期客户已经开始在设计SoC时采用最新的SerDes技术,Cadence欢迎更多客户积极参与。关于楷登电子 CadenceCadence 公司致力于推动电子系统和半导体公司设计创新的终端产品,以改变人们的工作、生活和娱乐方式。客户采用 Cadence的软件、硬件、IP 和服务,覆盖从半导体芯片到电路板设计乃至整个系统,帮助他们能更快速向市场交付产品。Cadence 公司创新的“系统设计实现” (SDE)战略,将帮助客户开发出更具差异化的产品,无论是在移动设备、消费电子、云计算、汽车电子、航空、物联网、工业应用等其他的应用市场。Cadence 公司同时被财富杂志评选为“全球年度最适宜工作的100家公司”之一。© 2018 Cadence Design Systems, Inc. 版权所有。在全球范围保留所有权利。Cadence、Cadence 徽标和www.cadence.com/go/trademarks中列出的其他Cadence标志均为 Cadence Design Systems, Inc. 的商标或注册商标。所有其他标识均为其各自所有者的资产。来源:Cadence楷登

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈