隆重介绍OpenVINO™2024.0:为开发者提供更强性能和扩展支持-电子产品世界论坛

betway88必威体育

电子产品世界 » 论坛首页 » 企业专区 » OpenVINO生态社区 » 隆重介绍OpenVINO™2024.0:为开发者提供更强性能和扩展支持

共1条 1/1 1 跳转至页

隆重介绍OpenVINO™2024.0:为开发者提供更强性能和扩展支持

nakey

高工

2024-03-22 14:41:32 打赏

只看楼主 1楼

欢迎来到 OpenVINO™ 2024.0，我们很高兴在这里推出一系列增强功能，旨在在快速发展的人工智能领域为开发者赋能！此版本通过动态量化、改进优化 GPU 以及对混合专家架构的支持，增强了大语言模型（LLM）的性能。OpenVINO™ 2024.0 使开发者能够有效利用人工智能加速，并对来自社区的持续贡献表示感谢。

大语言模型推理的提升

大语言模型（LLM）没有消失的迹象，模型和使用用例不断涌现。我们将继续我们的使命，以便加速模型，并使这些模型的推理更加经济实惠。

性能和准确性的提升

在本版本中，我们一直致力于提高 LLM 的开箱即用性能，并对运行时和工具进行了一些重要更改。

首先，我们介绍了 CPU 平台的动态量化和缓存压缩机制。KV 缓存压缩功能使我们能够更高效地生成大序列。动态量化通常会提高模型其它部分（嵌入映射和前馈网络）的计算和内存消耗。

对于 GPU 平台，我们还通过在内核和整个堆栈中引入优化来改进生成特性。我们还实现了更高效的缓存处理，这有助于使用波束搜索生成。

其次，虽然性能一直是一个讨论的话题，但准确性也至关重要。我们提高了 NNCF 中权重压缩算法的准确性。我们介绍了使用数据集的统计数据压缩权重的能力，并介绍了 AWQ 算法的实现，以进一步提高准确性。此外，通过我们与 Hugging Face Optimum Intel 的集成，您现在可以直接通过 Transformers API 压缩模型，如下所示：

（此处的代码来源：https://github.com/huggingface/optimum-intel/pull/538)

注意：使用设置为 True 的 load_in_4bit 选项，并在对 from_pretrained 方法的调用中传递 quantiation_config 权限，这将为您完成所有压缩工作。更重要的是，我们已经为大多数热门的模型添加了量化配置，其中包括 Llama2、StableLM、ChatGLM 和 QWEN 等模型；因此，对于这些模型，您根本不需要传递 config 来获得4位压缩。

想了解关于我们的算法质量的更多信息，您可以查询OpenVINO™ 文档：https://docs.openvino.ai/nightly/weight_compression.html

或者 GitHub上的NNCF 文档：https://github.com/openvinotoolkit/nncf/blob/a917efd684c2febd05032a8f2a077595fb73481a/docs/compression_algorithms/CompressWeights.md#evaluation-results

支持混合专家（MoE）架构

混合专家（MoE）代表了下一个主要的体系架构演变，它为 LLM 带来了更好的准确性和性能。它从 Mixtral 开始，并迅速发展到更多的模型和框架，允许从现有模型创建基于 MoE 的模型。在整个2024.0版本中，我们一直致力于启用这些体系结构并提高性能。我们不仅对这些模型进行了有效的转换，而且还更改了一些内部结构，以更好地处理运行时内专家的动态选择。

我们正在对 Hugging Face Optimum-Intel 进行升级，以使这些模型的转换是透明的。

对新平台的变化以及现有平台的增强

Intel NPU 更广泛的接入

随着 Intel®Core™Ultra 的发布，我们的 NPU 加速器终于跟广大的开发者见面了。从软件和硬件的角度来看，这是一款不断发展的产品，我们对它所能实现的功能感到兴奋。您可能已经看到了一些在 NPU 上运行的 OpenVINO™ Notebooks 的演示

OpenVINO™ notebooks running on NPU:

https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/230-yolov8-optimization

在本版本中，当您通过我们最热门的分发渠道 PyPI 安装 OpenVINO™ 时，我们将提供 NPU 支持。有几点需要注意：

● NPU 要求在系统中安装驱动程序，因此如果您打算使用它，请确保遵循此简短指南：

https://docs.openvino.ai/nightly/openvino_docs_install_guides_configurations_for_intel_npu.html

● NPU 目前不包括在自动设备选择逻辑中(https://docs.openvino.ai/nightly/openvino_docs_OV_UG_supported_plugins_AUTO.html)，因此，如果您计划在NPU上运行您的模型，请确保您明确指定设备名称（例如NPU），如下所示：

compiled_model = core.compile_model(model=model, device_name="NPU")

改进对 ARM CPU 的支持

线程是我们在 ARM 平台上还未有效实现的事情之一，这拖慢了我们的性能。我们与 oneTBB 团队（我们默认的线程引擎提供商）合作，改变了对 ARM 的支持，并显著提高了我们的性能。同时，在对某些操作的精度进行了一些研究后，我们在 ARM CPU 上默认启用了 fp16 作为推理精度。

总的来说，这意味着 ARM CPU 的性能更高，也意味着 OpenVINO Streams 功能的实现(https://docs.openvino.ai/nightly/openvino_docs_deployment_optimization_guide_tput_advanced.html#openvino-streams)，该功能允许在多核平台上获得更高的吞吐量。

删除一些遗留项

2024.0 是我们的下一个主要版本，传统上这是我们从工具套件中删除过时组件的时候。

2年前，我们大幅度改变了 API 以跟上深度学习领域的发展。但为了最大限度地减少对使用OpenVINO™的现有开发者和产品的影响，我们也支持 API 1.0。从那以后发生了很多变化，我们现在正在完全删除旧的 API。更重要的是，我们还删除了标记为弃用的工具。这包括：

● 训练后量化工具，也称为POT

● 准确性检查框架

● 部署管理器

这些工具是 openvino-dev 包的一部分，这个包已经有一段时间没有强制使用了。我们将为那些继续使用我们的离线模型转换工具model Optimizer的用户保留它。

如果您无法迁移到新的API，那么您很有可能继续使用我们的一个长期支持版本，例如2023.3。

新的及修改过的 Notebooks

我们将继续展示人工智能领域最重要的更新，以及如何利用OpenVINO™来加速这些场景。以下是我们一直在做的工作：

● Mobile language assistant with MobileVLM

https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/279-mobilevlm-language-assistant

● Depth estimation with DepthAnything

https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/280-depth-anything

● Multimodal Large Language Models (MLLM) Kosmos-2

https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/281-kosmos2-multimodal-large-language-model

● Zero-shot Image Classification with SigLIP

https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/282-siglip-zero-shot-image-classification

● Personalized image generation with PhotMaker

https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/283-photo-maker

● Voice tone cloning with OpenVoice

https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/284-openvoice

● Line-level text detection with Surya

https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/285-surya-line-level-text-detection

● Zero-shot Identity-Preserving Generation with InstantID

https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/286-instant-id

● LLM chatbot 和 LLM RAG pipeline已通过新模型的集成进行了更新：minicpm-2b-dpo、gemma-7b-it、qwen1.5-7b-chat、baichuan2-7b-chat

https://github.com/openvinotoolkit/openvino_notebooks/blob/main/notebooks/254-llm-chatbot/254-llm-chatbot.ipynb

https://github.com/openvinotoolkit/openvino_notebooks/blob/main/notebooks/254-llm-chatbot/254-rag-chatbot.ipynb

在 OpenVINO™ 的历史上，我们看到了许多激动人心的项目！我们决定列出一份使用OpenVINO™ 的绝妙项目列表(https://github.com/openvinotoolkit/awesome-openvino)，它还在继续快速增长着！为您的项目创建一个拉取请求，使用您项目的 “mentioned in Awesome” 徽章，并与我们分享您的经验！

我们的开发人员基数正在增长，我们感谢社区正在做出的所有改变和改进。令人惊讶的是，你们中的一些人已经明确表示“正忙于帮助改进 OpenVINO™”，谢谢！

对计算机视觉感兴趣？这个社区推荐给你~

>>点击了解OpenVINO生态开发社区

关键词： OpenVINO 2024.0 github.co

共1条 1/1 1 跳转至页

发新帖

每日签到

有奖活动
【有奖活动】分享技术经验，兑换京东卡
话不多说，快进群！
请大声喊出：我要开发板！
【有奖活动】EEPW网站征稿正在进行时，欢迎踊跃投稿啦
奖！发布技术笔记，技术评测贴换取您心仪的礼品
打赏了！打赏了！打赏了！

打赏帖
与电子爱好者谈读图二被打赏50分
【FRDM-MCXN947评测】Core1适配运行FreeRtos被打赏50分
【FRDM-MCXN947评测】双核调试被打赏50分
【CPKCORRA8D1B评测】---移植CoreMark被打赏50分
【CPKCORRA8D1B评测】---打开硬件定时器被打赏50分
【FRDM-MCXA156评测】4、CAN loopback模式测试被打赏50分
【CPKcorRA8D1评测】--搭建初始环境被打赏50分
【FRDM-MCXA156评测】3、使用FlexIO模拟UART被打赏50分
【FRDM-MCXA156评测】2、rt-thread MCXA156 BSP制作被打赏50分
【FRDM-MCXN947评测】核间通信MUTEX被打赏50分

热门分类
STM32	MCU
通讯及无线技术	物联网技术
电子DIY	板卡试用
基础知识	软件与操作系统
我爱生活	小e食堂

EEPW论坛

隆重介绍OpenVINO™2024.0:为开发者提供更强性能和扩展支持

回复