新的 Tensilica AI 引擎提高了性能,AI 加速器为消费、移动、汽车和工业 AI 系统级芯片设计提供了一站式解决方案
内容提要
·面向特定领域、可扩展和可配置的人工智能平台,基于成熟的、经过量产验证的 Tensilica 架构
·为终端侧AI应用提供行业领先的性能和能效
·全面、通用的人工智能软件,满足所有目标市场的需求
·低端、中端和高端人工智能产品系列,适用于所有的 PPA 目标和成本预算
·目前可从 8 GOPS 扩展到 32 TOPS,并可扩展到上百 TOPS 以满足未来的人工智能需求
中国上海,2021年9月14日——楷登电子(美国 Cadence 公司,NASDAQ:CDNS)今日发布了用于加速人工智能系统级芯片开发的 Tensilica? AI 平台,包括针对不同的数据要求和终端侧 (on-device) AI 要求而优化的三个支持产品系列。全面的 Cadence? Tensilica AI 平台涵盖低端、中端和高端市场,提供了可扩展、节能的设备端到边缘端人工智能处理功能,这是当今日益普遍的人工智能系统级芯片设计的关键。与业界领先的独立 Tensilica DSP 相比,新的配套 AI 神经网络引擎 (NNE) 每次推理的能耗降低了 80%,并提供超过 4 倍的 TOPS/W性能,而神经网络加速器 (NNA) 通过一站式解决方案提供旗舰级的 AI 性能和能效。
针对智能传感器、物联网 (IoT) 音频、手机视觉/语音 AI、物联网视觉和高级驾驶辅助系统 (ADAS) 应用,Tensilica AI 平台通过一个通用软件平台提供最佳的功耗、性能和面积 (PPA) 以及可扩展性。Tensilica AI 平台产品系列依托于大获成功的 Tensilica DSP,Tensilica DSP 针对特定的应用,已经在消费、移动、汽车和工业市场的领先人工智能系统级芯片中投入量产,包括:
·AI Base:包括用于音频/语音的热门 Tensilica HiFi DSP、Vision DSP 以及用于雷达/激光雷达和通信的 ConnX DSP,与 AI 指令集架构 (ISA) 扩展结合使用。
·AI Boost:增加了一个配套的 NNE,最初是 Tensilica NNE 110 AI 引擎,可从 64 GOPS 扩展到 256 GOPS,并提供并发信号处理和高效推理。
·AI Max:包括 Tensilica NNA 1xx AI 加速器系列——目前包括 Tensilica NNA 110 加速器和 NNA 120、NNA 140 以及 NNA 180 多核加速器选项——该系列集成了 AI Base 和 AI Boost 技术。多核 NNA 加速器可以扩展到 32 TOPS,而未来的 NNA 产品的目标是扩展到上百 TOPS。
所有的 NNE 和 NNA 产品都包括用于提高性能的随机稀疏计算、旨在减少内存带宽的运行时张量压缩,以及可以减少模型大小的修剪和聚类功能。
该全面的通用人工智能软件面向所有目标应用,简化了产品开发,并能随着设计要求的变化而灵活轻松地迁移。该软件包含 Tensilica Neural Network Compiler,该产品支持以下工业标准的框架:TensorFlow、ONNX、PyTorch、Caffe2、TensorFlowLite 和 MXNet,用于自动生成端到端的代码;Android Neural Network Compiler;TFLite Delegates,用于实时执行;以及 TensorFlowLiteMicro,用于微控制器级设备。
“AI 系统级芯片开发者面临的挑战是如何让具有成本效益、差异化的产品更快地进入市场,提供更长的电池寿命和可扩展的性能。”Cadence 公司副总裁兼 IP 事业部总经理 Sanjive Agarwala 表示,“我们拥有成熟、可扩展且可配置的平台,基于我们一流的 Tensilica DSP,具有通用的人工智能软件,Cadence 将帮助AI系统级芯片开发者最大限度地降低开发成本,并满足紧迫的上市时间要求。通过在所有性能和预算水平上实现 AI 赋能,Cadence 正在推动各地人工智能系统实现快速部署。”
客户反馈
“扩展低功耗的终端侧 AI 功能需要极其高效的多传感计算。Cadence 和 TensorFlow Lite for Microcontrollers (TFLM) 团队多年来一直携手合作,共同开发解决方案,以实现人工智能领域最前沿的高能效应用。实时音频网络使用基于 LSTM 的神经网络算子以获得最佳性能和效率的使用趋势就是一个关键的例子。通过与 Cadence 密切合作,我们正在 Cadence Tensilica HiFi DSP 上集成一个高度优化的 LSTM 算子,大大改善关键用例(如语音通话降噪)的性能。我们很高兴能继续这项合作,并在低功耗人工智能领域提供引领行业的创新。”
- Pete Warden,Google TensorFlow Lite Micro 技术负责人
“在我们的 KLT720 上部署设备内置 AI 是我们的客户取得成功的关键,也是我们实现‘让人工智能无处不在、惠及所有人’这一使命的关键,KLT720 是具有1.4TOPS性能的人工智能系统级芯片,专门面向汽车、智能家居、智能安防、工业控制应用、医疗和 AI 物联网 (AIoT)。Cadence 的 Tensilica Vision DSP 性能高、功耗低、计算能力强大、带有 AI ISA 扩展及所需的 AI 软件,可以应对最新的 AI 挑战。”
- Albert Liu,Kneron 创始人兼首席执行官
“将 Cadence Tensilica HiFi 4 DSP 集成到 NXP的 i.MX RT600 跨界 MCU 中,不仅为广泛的音频和语音处理应用提供了高性能 DSP 功能,而且还提高了推理性能,即使在超低功耗、电池供电的产品中也能实现人工智能技术。HiFi 神经网络库使 NXP 能够充分利用 HiFi 4 DSP 的 AI 性能,并将其整合到支持 TensorFlow Lite Micro 和 Glow ML 推理引擎的 NXP eIQ 机器学习软件开发环境中。”
- Cristiano Castello,NXP Semiconductors 微控制器产品创新资深总监
“随着人工智能应用迅速从云端扩展到边缘,集成终端侧的人工智能加速器已成为满足 ADAS、移动、智能传感器和物联网低延迟要求的必要条件。AI 系统级芯片需要使用成熟的加速器 IP,以满足每个市场的不同需求,并包含一个全面的软件解决方案。应对性能和功耗需求的不断变化,Cadence 凭借 Tensilica AI Base、AI Boost 和 AI Max 技术提供了一条清晰的迁移路径,成为终端侧 AI IP 全面解决方案市场上广受认可的 IP 供应商。”
- Mike Demler,The Linley Group 高级分析师
可用性
NNE 110 AI 引擎和 NNA 1xx AI 加速器系列支持 Cadence 的智能系统设计 (Intelligent System Design?) 战略,该战略旨在为系统级芯片的卓越设计提供普适智能支持,预计将在 2021 年第四季度全面上市。