0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CW32L012与STM32G431的CORDIC三角函数运算性能对比

jf_09510355 来源:jf_09510355 作者:jf_09510355 2025-12-29 15:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文对比均为作者实测,结果仅供参考,可附代码供有意者评估~

STM32G431是STM32家族中较新的产品。CW32L012也是武汉芯源半导体最新推出的混合信号MCU,让我们深入分析基于各自芯片CORDIC协处理器的三角运算性能对比。对比结果出乎意料。

一、硬件架构

wKgZO2lSMoWACLs6AACFW1xwJ3k646.png


二、运算100W次SIN30度与COS30度的代码实现


1.CW32L012


CW32L012的CORDIC提供某些数学函数的硬件加速,特别是三角函数9,通常用于电机控制、计量、信号处理和许多其他应用。与软件实现相比,它加快了这些功能的计算速度,允许较低的工作频率,或释放处理器周期以执行其他任务。

CW32L012的CORDIC支持余弦 cos、正弦 sin、相位角 atan2、模 hypot、反正切 atan、双曲余弦 cosh、双曲正弦 sinh、双曲反正切 atanh 函数运算。

CW32L012使用CORDIC运算100W次SIN30度与COS30度的代码实现如下:

 
int32_t angle; 
 
void RCC_Configuration(void)
{
   SYSCTRL_HSI_Enable(SYSCTRL_HSIOSC_DIV1);
    SYSCTRL_HCLKPRS_Config(SYSCTRL_HCLK_DIV1);
    SYSCTRL_PCLKPRS_Config(SYSCTRL_PCLK_DIV1);
    SYSCTRL_SystemCoreClockUpdate(96000000);
}
void performance_test1(unsigned long iterations)
{
 unsigned long i=0;
  int32_t  y1,y2;
  float  y11,y22;  
 for(i=1;i<=iterations;i++)
 {       
  while (CORDIC_GetStatus().busy);  
    CW_CORDIC- >Z =angle; // 写入Z寄存器启动运算    
    // 等待运算完成
    while (!CORDIC_GetStatus().eoc); //运算完成标志硬件置1,读取运算结果硬件清0
    // 读取结果  
//y1=CW_CORDIC->Y;//sin(PI/6);  // 正弦结果在Y寄存器 Q1.31格式 根据需要使用
//y2=CW_CORDIC->X;//cos(PI/6); // 余弦结果在X寄存器 Q1.31格式 根据需要使用
  //y11=q1_31_to_float(y1);   //正弦结果转浮点数 根据需要使用
  //y22=q1_31_to_float(y2);   //余弦结果转浮点数 根据需要使用
 }
}
void BTIM1_Configuration(void)     //1ms进一次中断
{
 BTIM_TimeBaseInitTypeDef BTIM_TimeBaseInitStruct = {0}; 
 __SYSCTRL_BTIM123_CLK_ENABLE();
  __disable_irq();
  NVIC_EnableIRQ(BTIM1_IRQn);
  __enable_irq(); 
 BTIM_TimeBaseInitStruct.BTIM_Mode = BTIM_MODE_TIMER; 
  BTIM_TimeBaseInitStruct.BTIM_Period = 1000 - 1;
  BTIM_TimeBaseInitStruct.BTIM_Prescaler = 96 - 1;    // 8
  BTIM_TimeBaseInit(CW_BTIM1, &BTIM_TimeBaseInitStruct); 
  BTIM_ITConfig(CW_BTIM1, BTIM_IT_UPDATE, ENABLE);
  BTIM_Cmd(CW_BTIM1, ENABLE);
}
unsigned int timecount=0;
unsigned int lastcmputetime=0;
int main(void)
{ 
    GPIO_InitTypeDef GPIO_InitStruct;
    char temp_buff1[4]; 
    RCC_Configuration();//时钏配置 
  cordic_init_t init = {
        .func = CORDIC_FUNC_COS,  // 选择余弦函数
        .scale = 0,              // 不使用扩展范围
        .format = CORDIC_FORMAT_Q1_31, // 使用q1.31格式
        .iter = CORDIC_ITER_20,  // 迭代次数
        .comp = 1,               // 硬件补偿伸缩因子
        .ie = 0,                 // 禁用中断
        .dmaeoc = 0,             // 禁用DMA
        .dmaidle = 0             // 禁用DMA空闲
    };  
  CORDIC_Init(&init);  //sin cos运算初始化    
    EAU_Init();// 初始化EAU    
   EAU_SetMode(EAU_MODE_UNSIGNED_DIV);// 设置为无符号除法模式       
  __SYSCTRL_GPIOC_CLK_ENABLE();    //GPIOC LED
    GPIO_InitStruct.Pins = GPIO_PIN_13;
    GPIO_InitStruct.Mode = GPIO_MODE_OUTPUT_PP;
    GPIO_Init( CW_GPIOC, &GPIO_InitStruct);
    GPIO_WritePin(CW_GPIOC,GPIO_PIN_13,GPIO_Pin_RESET);
  BTIM1_Configuration(); //1MS    
     OLED_Init();               //清屏
      OLED_Printf(0,0,OLED_6X8," SIN/COS COMPUTE Test ");
   OLED_Printf(0,16,OLED_6X8,"  For 1000000 Times ");   
   OLED_Update();     
   angle = float_to_q1_31(0.167);//float_to_q1_15   // 0.25=1/4,即:运算45度=PI/4,换算为Q1.31格式,   //0.167=1/6 PI/6=30度
  while (1)
    {   
   sprintf(temp_buff1, " CW32L012 start......      ");
      OLED_Printf(0, 32, OLED_6X8, temp_buff1);
      OLED_Printf(0, 48, OLED_8X16, "                 ");
   OLED_Update();   
   timecount=0;
   performance_test1(1000000);
   lastcmputetime=timecount;      
   sprintf(temp_buff1, " CW32L012 used time:    ");
      OLED_Printf(0, 32, OLED_6X8, temp_buff1);
   sprintf(temp_buff1, "     %d mS    ", lastcmputetime);
      OLED_Printf(0, 48, OLED_8X16, temp_buff1);OLED_Update();   
   timecount=0;
   while(timecount< 4000); //等待2S
    }   
}
void BTIM1_IRQHandler(void)
{
  /* USER CODE BEGIN */
  if (BTIM_GetITStatus(CW_BTIM1, BTIM_IT_UPDATE))
  {
     BTIM_ClearITPendingBit(CW_BTIM1, BTIM_IT_UPDATE);     
     timecount++;
 }
  /* USER CODE END */
}

运算结果:

wKgZPGlSLYuAUBxWAATqA6rR21E445.png

2.STM32G431



/* Private variables ---------------------------------------------------------*/
CORDIC_HandleTypeDef hcordic;
DMA_HandleTypeDef hdma_cordic_read;
DMA_HandleTypeDef hdma_cordic_write;
 
TIM_HandleTypeDef htim2;
 
/* USER CODE BEGIN PV */
 
/* Array of calculated sines in Q1.31 format */
static int32_t aCalculatedSin[2];
/* USER CODE END PV */
 
/* Private function prototypes -----------------------------------------------*/
void SystemClock_Config(void);
static void MX_GPIO_Init(void);
static void MX_DMA_Init(void);
static void MX_TIM2_Init(void);
static void MX_CORDIC_Init(void);
/* USER CODE BEGIN PFP */
CORDIC_ConfigTypeDef sCordicConfig;
 
int32_t angle; 
float anglef;
/* USER CODE END PFP */
 
/* Private user code ---------------------------------------------------------*/
/* USER CODE BEGIN 0 */
 
unsigned int timecount=0;
unsigned int lastcmputetime=0;
void performance_test3(unsigned long iterations) //使用cordic功能运算
{
 unsigned long i=0;
 int32_t y1,y2;
 float result;
  float  y11,y22;
 for(i=1;i<=iterations;i++)
 {
  while (HAL_CORDIC_GetState(&hcordic) != HAL_CORDIC_STATE_READY)
  {
  } 
  if (HAL_CORDIC_Calculate_DMA(&hcordic, &angle, aCalculatedSin,1, CORDIC_DMA_DIR_IN_OUT) != HAL_OK)
  {
   Error_Handler();
  }    
 
//  y1=aCalculatedSin[0]; //SIN运算结果Q1.31格式
//  y2=aCalculatedSin[1]; //COS运算结果Q1.31格式
//   y11=(float)y1 / 2147483648.0; // 2^31  换算成符点数 正弦结果转浮点数 根据需要使用
//   y22=(float)y2 / 2147483648.0; // 2^31  换算成符点数 余弦结果转浮点数 根据需要使用
 }
} 
 
/* USER CODE END 0 */
 
/**
@brief  The application entry point.
@retval int
*/
int main(void)
{
  /* USER CODE BEGIN 1 */
  char temp_buff1[50];
  /* USER CODE END 1 */
  /* MCU Configuration--------------------------------------------------------*/
  /* Reset of all peripherals, Initializes the Flash interface and the Systick. */
  HAL_Init();
  /* USER CODE BEGIN Init */
  /* USER CODE END Init */
  /* Configure the system clock */
  SystemClock_Config();
  /* USER CODE BEGIN SysInit */
  /* USER CODE END SysInit */
  /* Initialize all configured peripherals /
  MX_GPIO_Init();
  MX_DMA_Init();
  MX_TIM2_Init();
  MX_CORDIC_Init();
  / USER CODE BEGIN 2 */
 sCordicConfig.Function         = CORDIC_FUNCTION_SINE;     /* sine function /
  sCordicConfig.Precision        = CORDIC_PRECISION_6CYCLES; / max precision for q1.31 sine /
  sCordicConfig.Scale            = CORDIC_SCALE_0;           / no scale /
  sCordicConfig.NbWrite          = CORDIC_NBWRITE_1;         / One input data: angle. Second input data (modulus) is 1 after cordic reset /
  sCordicConfig.NbRead           = CORDIC_NBREAD_2;          / One output data: sine /
  sCordicConfig.InSize           = CORDIC_INSIZE_32BITS;     / q1.31 format for input data /
  sCordicConfig.OutSize          = CORDIC_OUTSIZE_32BITS;    / q1.31 format for output data */
  if (HAL_CORDIC_Configure(&hcordic, &sCordicConfig) != HAL_OK)
  {
    /* Configuration Error */
    Error_Handler();
  }  
  HAL_TIM_Base_Start_IT(&htim2);
  OLED_Init();
  OLED_Printf(0,0,OLED_6X8," SIN/COS COMPUTE Test ");
  OLED_Printf(0,16,OLED_6X8,"  For 1000000 Times ");
 OLED_Update();
 angle=(int32_t)round(0.167 * 2147483648.0); // 2^31 // 0.25=1/4,即:运算45度=PI/4,换算为Q1.31格式,   //0.167=1/6 PI/6=30度
 anglef=0.523; //0.785(45度弧度制)=45度/180度*3.14  0.523(30度弧度制)=30/180*3.14
  /* USER CODE END 2 */
  /* Infinite loop /
  / USER CODE BEGIN WHILE /
  while (1)
  {
    / USER CODE END WHILE */
    /* USER CODE BEGIN 3 */
    sprintf(temp_buff1, " STM32G431 start......      ");
      OLED_Printf(0, 32, OLED_6X8, temp_buff1);
      OLED_Printf(0, 48, OLED_8X16, "                 ");
   OLED_Update();
   timecount=0;
   performance_test3(1000000);
   lastcmputetime=timecount;  
   sprintf(temp_buff1, " STM32G431 used time:    ");
      OLED_Printf(0, 32, OLED_6X8, temp_buff1);
   sprintf(temp_buff1, "     %d mS    ", lastcmputetime);
      OLED_Printf(0, 48, OLED_8X16, temp_buff1);
    OLED_Update();  
     timecount=0;
   while(timecount< 4000); //�ȴ�2S
  }
  /* USER CODE END 3 */
}
void HAL_TIM_PeriodElapsedCallback(TIM_HandleTypeDef *htim)
{
 static unsigned int flag=0;
  /* Prevent unused argument(s) compilation warning */
  if(htim- >Instance==TIM2)
 {
  timecount++;
//  if(timecount>=500) 
//  {timecount=0;
//   flag=1-flag;
//   HAL_GPIO_TogglePin(GPIOC, GPIO_PIN_13);
//  }
 }

运算结果:

wKgZO2lSM46AVrH4AATz6k7S6Sg451.png

计算100W次SIN30度 与COS30度。其中运算结果数据表示为:CORDIC运算结果均为Q1.31格式表示 。

时间对比参考如下:

wKgZPGlSM5-AVSL6AABeqB2ryvE682.png

结果确实出乎意料,没想到同样的CORDIC协处理器运算,M4F内核的G4芯片表现竟不如M0+内核的CW32L012芯片!

为什么STM32G431会慢于CW32L012?我在浏览论坛时,也发现有人反馈G4的CORDIC表现差强人意。

作者猜想,STM32基于CUBE软件生成的HALL库文件中规则性判断语句较多,可能会引起一定时间的延迟。

另外应该还有其它原因?!

下表是两款芯片在不同条件下,计算100W次SIN30度与COS30度的时间快慢表现。

wKgZPGlSM8OAchK1AACFa2c1EiE104.png

最后温馨提示:STM32G431带有DSP功能,DSP运算比CORDIC要快。 对比测试作为性能评估参考。大家根据自己项目定位和预算,选择合适性能的芯片就可以了。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • CORDIC
    +关注

    关注

    0

    文章

    43

    浏览量

    20631
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    CW32L012的FOC电机驱动的运放电路设计解析

    CW32L012由于有两个内置运放,所以在设计FOC电机驱动时,可以考虑使用内置运放做单/双电阻的电流采样。 以下图B相为例,运放及外围电路构成同相放大电路,由于相电流存在正负方向,所以需要增加偏置
    的头像 发表于 04-28 15:00 560次阅读
    <b class='flag-5'>CW32L012</b>的FOC电机驱动的运放电路设计解析

    CW32L012电压电流表设计思路

    CW32L012C8T6 定位为 电机控制、电源管理、智能仪表、工业传感器 等领域的高性价比解决方案,尤其适合需要 高精度模拟信号处理 + 复杂数字控制 的混合信号系统, ARM
    的头像 发表于 03-31 21:32 715次阅读

    FOC控制中如何利用芯片内部的运放设计电流采样电路?

    最近开发电机控制的项目,我开始使用最新的CW32L012做主控,CW32L012作为混合信号MCU,相比于传统MCU控制,集成度较高,性能当然也更好,加之又是48Pin的芯片,因此我开始做的关于
    的头像 发表于 01-05 16:50 3078次阅读
    FOC控制中如何利用芯片内部的运放设计电流采样电路?

    CW32L012STM32F103的三角运算性能对比

    ​  CW32L012STM32F103在定位和性能上差异显著,在三角函数运算性能上的
    的头像 发表于 12-29 15:32 2651次阅读
    <b class='flag-5'>CW32L012</b>与<b class='flag-5'>STM32</b>F103的<b class='flag-5'>三角</b><b class='flag-5'>运算</b><b class='flag-5'>性能对比</b>

    CORDIC模块——提高计算能力的性价比神器

    单片机进行复杂的数学函数计算特别是控制系统中常用的三角函数计算,在有精度要求的情况下,我们经验上往往会选用带有DSP模块的MCU或者专用的DSP芯片去实现。但由于带有DSP模块的芯片往往内核等级较高
    的头像 发表于 12-22 12:39 3879次阅读
    <b class='flag-5'>CORDIC</b>模块——提高计算能力的性价比神器

    CW32L012小型机器人控制评估板活动 四足机器人+智能小车 开箱评测

    CW32L012活动相关资料链接:https://dwi41yhz703.feishu.cn/wiki/B1Ihw31ebiX0vkkhQr2cINnkn1g 小型机器人+智能小车 主控板简介
    发表于 11-24 23:44

    **CW32L012****开发评估板的第一个程序**

    CW32L012****开发评估板的第一个程序 最近以15.99在CW32生态社区入手了这块CW32L012开发评估板,我迫不及待的烧录进电灯程序,看看这块板子是否是正常的,能否满足我后面的学习
    发表于 11-22 00:09

    CW32L012小机器人的电机控制

    线的大功率调速,电机的控制性能直接决定了系统的响应速度、运行精度、能耗效率与稳定性。这里分享CW32L012小机器人的正反转、调速的电机控制 电机的正反转 从配套的开发板资料介绍中可以知道,这是电机的驱动芯片RZ7899 从立创商城下载该芯片的数据
    的头像 发表于 11-21 13:18 2663次阅读
    <b class='flag-5'>CW32L012</b>小机器人的电机控制

    使用芯源CW32的CW32L012开发评估板做了spi屏幕驱动

    CW32生态社区以极高的性价比入手了这块CW32L012开发评估板,开发板以底板、核心板、1.77寸TFT显示屏构成,所有的IO口都引出了排针,这点好评,使用杜邦线可以非常方便的连接其他模块。引脚
    的头像 发表于 11-21 11:34 962次阅读
    使用芯源<b class='flag-5'>CW</b>32的<b class='flag-5'>CW32L012</b>开发评估板做了spi屏幕驱动

    三角函数的查表法

    在单片机运算中,以整数形式或说定点数形式进行运算会比以浮点数形式运算快。电机控制中,经常需要用到三角函数,正弦,余弦,或者正切,求解这一类函数
    发表于 11-19 08:06

    三角启动电路图资料

    三角启动电路图,解决电机启动电流大问题
    发表于 10-10 14:29 3次下载

    坚持继续布局32位MCU,进一步完善产品阵容,96Mhz主频CW32L012新品发布!

    CW32L012基于ARM® Cortex-M0+内核,主频高达96MHz,同时集成了CORDIC硬件单元、扩展算术运算单元(EAU),可以提供部分数学函数、算术
    的头像 发表于 07-16 16:34 1644次阅读
    坚持继续布局32位MCU,进一步完善产品阵容,96Mhz主频<b class='flag-5'>CW32L012</b>新品发布!

    坚持继续布局32位MCU,进一步完善产品阵容,96Mhz主频CW32L012新品发布!

    基于CW32L01x系列低功耗微控制器家族的全新成员:CW32L012系列产品。 CW32L012基于ARM® Cortex-M0+内核,主频高达96MHz,同时集成了CORDIC硬件
    发表于 07-16 16:32

    请问STM32G431内部运放1和2输出连接的ADC为什么不是OPAMP?

    请问下大家,STM32G431 芯片UVW相的电流检测,配置使用内部运放PGA,看到G431-ESCdemo板对应motor workbench配置,为什么UV相的运放输出分别是ADC1 3通道
    发表于 06-10 07:39

    请问STM32G431内部运放1和2输出连接的ADC为什么不是OPAMP?

    请问下大家,STM32G431 芯片UVW相的电流检测,配置使用内部运放PGA,看到G431-ESCdemo板对应motor workbench配置,为什么UV相的运放输出分别是ADC1 3通道
    发表于 06-06 07:47