地表最强M85内核芯片-RA8P1测评 | 技术集结

2025-07-31 69103阅读

瑞萨电子宣布推出针对人工智能AI)、机器学习(ML)应用以及实时分析的RA8P1微控制器MCU)产品群。该系列MCU通过将1GHz Arm Cortex-M85250MHz Cortex-M33 CPU核心与Arm EthosTM-U55神经处理单元(NPU)相结合,从而树立MCU性能的新标杆。作为瑞萨电子深度合作伙伴,RT-Thread已率先完成对该芯片的适配支持。本文将详解如何快速移植RT-Thread,带大家一起体验M85!

70a7c90c-5944-11f0-9cf1-92fbcf53809c.png

目录

芯片介绍

RT-Thread 移植

测试结果

总结

1

芯片介绍

从数据手册上看出 RA8P1 是一颗双核异构的芯片,由大核Cortex-M85+小核Cortex-M33组成。在此基础上额外集成了 NPU 运算单元,专门用于加速机器学习推论所设计。

主频上,M85主核心竟然达到了1GHZ,这个速度是以往系列都没有的主频,一个字“快”,

M33 从核心主频是 250MHZ,同时 RA8P1 有64KB的数据+指令Cache,其中我手上这颗R7KA8P1KFLCAC芯片: CPU0 和 CPU1对应的 I/D Caches 和 C/S Caches 容量各 32KB。

外设接口上,RA8P1最多的支持10路SCI外设接口(可以灵活配置成UART,SPI,I2C),OSPI x 2可以拓展外扩最高8线 的 Hyperam,flash 等存储器件。

人机交互接口上,和RA8D1一样支持 MIPI-DSI,GLCDC 可以二选一搭配 MIPI/RGB 接口的屏幕使用。

除CEU(数字摄像头接口)外,视频输入接口新增MIPI-CSI外设,显著提升摄像头数据带宽,确保AI处理场景下前置输入带宽的稳定性。

在网络接口上,RA8P1支持L3以太网交换机模块(ESWM),允许连接到网络的各种设备进行数据交换和相互通信。其支持多协议接口,它能够在同一网络或不同网络接口协议之间自主路由帧数据,适用于网关应用。

2

RT-Thread 移植

让我们快速移植 RT-Thread体验下:

参考RT-Thread文档中心针对RA系列的BSP制作教程+Vision Board SDK仓库,由于RA8P1的启动方式是大核先启动,那么我们可以先以单核方式快速移植RTT,这里不多加赘述。

下载E2Studio即可快速体验裸机开发;

将 RT-Thread 源码加入工程,加入设备驱动框架对接层;

运行 RT-Thread 的基本条件是Systick时钟和串口驱动,对于RT-Thread中已经实现的非常完善;

外设上在FSP中只需要配置一个通讯的串口即可

71041ff4-5944-11f0-9cf1-92fbcf53809c.png

正式开始移植

在移植过程中可以用过E2Studio进行针对多核进行调试仿真,体验下来也是比较流畅的:

71126a3c-5944-11f0-9cf1-92fbcf53809c.png

如果想要启动从核(M33)可以直接调用FSP封装好的库函数:

713833c0-5944-11f0-9cf1-92fbcf53809c.png

至此RT-Thread已经正常的运行起来了:

715583f8-5944-11f0-9cf1-92fbcf53809c.png

在BSP根目录下启动env工具:RT-Thread具有完善的软件生态,我们可以快速的针对芯片进行性能测试,那么有请第一个软件包登场:CoreMark

71686fea-5944-11f0-9cf1-92fbcf53809c.png

使用env 配置工具在软件包仓库中使能COREMARK软件包,通过pkgs --update拉取到本地项目中参与构建:

71762af4-5944-11f0-9cf1-92fbcf53809c.png

设置 corkmark 运算迭代次数为:80000(按需设置,对于性能较强的芯片需要增加次数)

718583a0-5944-11f0-9cf1-92fbcf53809c.png

hal_entry.c中,执行 coremark 程序进行跑分测试:

71968038-5944-11f0-9cf1-92fbcf53809c.png

初步使用O0等级优化测试结果:

71a64662-5944-11f0-9cf1-92fbcf53809c.png

什么M85内核才区区500分?这和理想中的分数天差地别了,接下来开始进行优化:

1 开启Dcache和Icache:

71c0f7be-5944-11f0-9cf1-92fbcf53809c.png

qemu-system-riscv32 -machine smartl -nographic -kernel rtthread.elf -cpu e906fd -gdb tcp::23333-S

2 修改测试区域内存为DTCM段:

71d4788e-5944-11f0-9cf1-92fbcf53809c.png

3

测试结果

CPU0:Cortex-M85 储存介质:MRAM(磁阻式随机存取内存)

编译器版本 : GCC13.2.1

编译参数:-mfloat-abi=hard -mfpu=fpv5-sp-d16Ofast

Coremark分数:4896.132056

71e40b82-5944-11f0-9cf1-92fbcf53809c.png

CPU1:Cortex-M33

储存介质:MRAM(磁阻式随机存取内存)

编译器版本 : GCC13.2.1

编译参数:-mfloat-abi=hard -mfpu=fpv5-sp-d16Ofast

Coremark分数:570.356473

71f5d740-5944-11f0-9cf1-92fbcf53809c.png

以上的测试结果是使用GCC工具链进行编译,更换成 ARMCLANG/LLVM 工具链跑分可能还会提升一些。

4

总结

RA8P1芯片搭载双核异构M85和M33内核,相较前代RA8系列在主频、带宽及外设接口方面实现显著性能提升,并集成Ethos-U55 NPU的32位AI加速微控制器(MCU)。

该芯片在语音、视觉及实时分析AI场景中表现出色,性能强劲。后续计划移植RP-Msglite组件,结合RT-Thread在RA8P1上实现双核间高效数据通信,充分释放双核性能潜力。