我的浮点心 – CLA简介(上)

在TI的产品线中,F2803x Piccolo™系列处理器主打低成本高效控制的路线。在数据计算部分,虽然有IQMath这个伪浮点数计算库,但是在平均最高60MHz的处理速度下,仍然后很多工作无法胜任。为了提高性价比,TI在其中引入了一个新的概念:控制率加速器(Control Law Accelerator, 简称CLA),主要功能是:在原有的CPU构架外,新增一个支持浮点运算的并行处理核心,实现“双核”控制。

什么时候需要用CLA?
1. 有大量的浮点数学运算,CPU在计算之余,还需要去响应各种外设的请求。
由于CLA是与原有的CPU并行进行计算,因此在原有的CPU中只需要设置好交换的数据并使能对应的CLA任务,CPU就可以去运行其它的任务,CLA运行完毕后会自动将规定好的数据传回。就好象对自己的助手说:“嘿,张三,帮我把这个表格按照公司的格式生成统计结果”,张三做完后会把数据送回来,而这段时间里你可以继续做其它的事情。
2. 采用IQMath库的时候,无法同时满足“精度”和“范围”的需求。
在IQMath库中,CPU将浮点运算转换成定点运算,因此有时无法在精度和范围两方面灵活互补,而CLA采用了浮点数,系统会自动对计算的精度和范围进行调整,达到最优的效果。
3. 程序需要对运行速度进行深度优化。
CLA运行的程序只能使用对应的汇编语言进行编程,用户可以在程序执行的流水线等待阶段插入不影响结果的语句,充分利用强大的计算能力,榨干处理器的每一点计算能力。

什么时候不适合使用CLA?
1. 有大量的判断、跳转语句(if…else… for… while…)需要运行。
由于CLA采用8级流水线结构,数据的计算能力非常强大,但是在判断和跳转语句中会造成后续的流水线失败,因此,大量的判断和跳转操作最好放在CPU中进行。
2. 需要访问复杂的外设。
CLA虽然和CPU共用大多数资源,但是前者只能访问PWM和ADC的有限的寄存器,其它的寄存器访问需要间接的向CPU请求,由此也可以看出来,CLA的存在,主要是为了强化基于PWM控制的运算,而CPU可以更轻松的控制丰富的外设。

CLA的有什么不足?
1. 与CPU共用内存资源
CLA没有自己的内存资源,因此必须从CPU中划分出对应的内存区域供CLA的程序和数据使用。
2. 没有只有乘法器和加法器
CLA只有乘法器和加法器,没有硬件除法器,因此除法运算需要的周期还是远大于乘法。

以上是关于选用CLA使用的一些简介。

28035内部温度传感器的使用

在TMS320F28035的Analog-to-Digital Convert (ADC)模块中,内置了一个温度传感器,在进行ADC的时候可以设置ADCINA5通道为内部温度传感器,并且对其进行采样。

1. 需要将设置ADCCTL1[Bit0:TEMPCONV]设置为1,以开启内部的温度传感器。
2. 根据说明,读取出厂预标定值,包括斜率(slope)和偏移(offset)。
0x3D7E82 – Slope (ºC / LSB, fixed-point Q15 format)
0x3D7E85 – Offset (0 ºC LSB value)
3. 设置转换。
以最快转换速度进行转换(ACQPS = 6; // 7 ADC Clock @ 60MHz):需要连续两次转换,并且读取后一次的值为准;
以超过550ns的速度进行转换(ACQPS >= 32; // 33 ADC Clock @ 60MHz ),可只读取一次。
4. 以公式进行转换
Temperature = (sensor – Offset) * Slop
5. 你会发现转换后的值不对。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

经试验,在室温20摄氏度的时候,采集到的值约为2190,slope 约等于 0.217,offset 为1750,计算得到的值为126摄氏度。
使用Fluke561红外温度监测仪进行扫描,CPU外壳部分温度约为30~34摄氏度,与计算得到的值相差较大。
将计算得到的温度值:126作为华氏度转换为摄氏度后,温度约为52.2摄氏度。考虑到温度传感器所采集的位置为结温,会高于外壳温度,因此,得出结论:
TMS320F28035处理器的ADC模块内部温度传感器所采到的值应该是华氏度,而不是摄氏度。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
华氏度 – 摄氏度转换公式:

华氏度=32+摄氏度×1.8
摄氏度=(华氏度-32)÷1.8

相关文档:
TMS320x2802x, 2803x Piccolo Analog-to-Digital
Converter (ADC) and Comparator Reference Guide

TMS320F2803x Piccolo MCU Silicon Errata
TMS320x2802x, 2803x Piccolo Datasheet

I2C模块的从机接收

今日在使用TMS320F28035的时候用到了I2C模块,两个同样的处理器通过I2C总线进行通讯。

在使用的过程中,”主->从”方向的通讯没有问题,但是在“请求 – 响应”的双向通讯中,总是出现问题。

具体表现为:

主机发送的 7-bit 从机地址之后的R/W位总是保持写入的状态(0),导致从机无法正常响应通讯的数据,总线保持繁忙状态。

程序参考了:2803x C/C++ Header Files and Peripheral Examples sprc892.zip

以及:PMBus sprabj6-Software Implementation of PMBus Over I2C.pdf

 

GPIO用做输入的问题

今天在使用TMS320F28035这款MCU的时候,出现了一个问题:

被用做输入的端口无法真实反映出外部的高低电平状态。

排除了外部的因素后,发现GPIO用做输入的时候,MCU内部的上拉电路仍然在起作用,并且影响着输入信号的电平状态。

解决方法:

由于GPIO端口(除了可以用作ePWM的端口)默认开启了内部上拉功能,因此:

用做输入端口时一定要关闭对应管脚内部的上拉功能

涉及到的寄存器为:GPAPUD / GPBPUD

28035之时钟选择

TMS320F28035这款DSP(现在应该是MCU了)具有2个片内时钟振荡器,同时具有1个晶振输入和1个外部时钟输入。

INTOSC1:片内时钟振荡器1(10MHz),可以为看门狗、系统内核、CPU定时器2提供时钟基准。

INTOSC2:片内时钟振荡器2(10MHz),可以为看门狗、系统内核、CPU定时器2提供时钟基准。

Crystal / Resonator:采用外部晶振作为时钟基准(XTAL),硬件上连接在X1 / X2脚。

External Clock Source:外部时钟源(XCLK – GPIO19 / GPIO38),如果没有使用外部晶振,那么可以使用一个外部的时钟源接入到XCLKIN管脚上,提供时钟基准。

默认情况下,系统内核时钟是由INTOSC1提供的,经过实际使用下来,片内的INTOSC1INTOSC2并不是很精确,并且受温度影响较大。如果使用外部晶振,应该如何切换呢?

1. 启用编辑受保护的寄存器;

1
EALLOW;

2. 将CLKCTL[XTALOSCOFF]设置为0,启用外部晶振;并将CLKCTL[XCLKINOFF]设置为1,禁用外部时钟输入;
参考操作:

2
SysCtrlRegs.CLKCTL.all = 0x2400;

3. 将CLKCTL[OSCCLKSRCSEL] 设置为1,使用外部晶振作为系统时钟源;此时,系统时钟无分频和倍频,需要重新设置PLLCR;
参考操作:

3
SysCtrlRegs.CLKCTL.all = 0x2401;

4. 重新设置PLLCR,并等待设置完毕;
参考操作:

4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
if (SysCtrlRegs.PLLSTS.bit.MCLKSTS != 1)
{
    SysCtrlRegs.PLLSTS.bit.MCLKOFF = 1;
    SysCtrlRegs.PLLSTS.bit.DIVSEL = 0;
    SysCtrlRegs.PLLCR.bit.DIV = 0x000C;
    while(SysCtrlRegs.PLLSTS.bit.PLLLOCKS != 1)
    {
        SysCtrlRegs.WDKEY = 0x0055;
        SysCtrlRegs.WDKEY = 0x00AA;
    }
    SysCtrlRegs.PLLSTS.bit.MCLKOFF = 0;
    DelayUs(20/2);
    SysCtrlRegs.PLLSTS.bit.DIVSEL = 0x2;
}
else
{
    asm(" ESTOP0");
}

5. 关闭内部晶振INTOSC1;
参考操作:

22
SysCtrlRegs.CLKCTL.all = 0x2501;

6. 禁止编辑受保护的寄存器;

23
EDIS;

这样DSP可以工作在一个相对稳定和精确地时钟基准下。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
参考文档:
P43 – TMS320x2803x Piccolo System Control and Interrupts Reference Guide (Rev. B)
From Ti.com

关于DSP供电GND的问题

今天在调试DSP的时候连续烧毁了3块2812,都很诡异,很无奈,很纠结。

鼓起勇气再试一次的时候,终于发现了问题所在:

每次在CCS连接仿真器的时候,+5V供电的电流就会突然升高,DSP的内核部分+1.8V和外设部分+3.3V的阻值<50Ω。初步认为是+5VGnd对保护地的压差>54V,连接仿真器的瞬间产生一个很大的冲击,将DSP内核烧掉。

问题待解决

关于EALLOW之类的汇编宏定义

今天,在编写TMS320F28035程序的时候,添加了某个配置功能,但必须要Rude Retry才能运行,否则无法采用Realtime Mode来运行程序。
后来,恢复到上一个运行正常的版本后,一点点加入之前添加的内容,终于发现了问题。原来是配置寄存器的时候调用了DRTM,但是配置完后没有使能ERTM。在配置寄存器之后,补上了一个ERTM就解决了问题。一时的疏忽大意,导致查找了将近半个小时的错误。

总结一下TI在TMS320F28xx标准库里定义的一些汇编语言:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
// 全局中断使能
#define  EINT   asm(" clrc INTM")
 
// 全局中断禁止
#define  DINT   asm(" setc INTM")
 
// Enable RealTime Mode, 使能实时模式
#define  ERTM   asm(" clrc DBGM")
 
// Disable RealTime Mode, 禁止实时模式
#define  DRTM   asm(" setc DBGM")
 
// E Allow, 解除保护,使能特殊寄存器的修改
#define  EALLOW asm(" EALLOW")
 
// E Disable,恢复保护,禁止特殊寄存器的修改
#define  EDIS   asm(" EDIS")
 
// Emulator Stop,停止仿真,程序在此处会停住
// 类似端点的的功能
#define  ESTOP0 asm(" ESTOP0")

当DRTM后,处理器是不能进入实时模式的,除非勾选了Rude Retry。

关于DSP — 算是开始吧

写过51的程序,写过PIC,最近专注于TI的处理器方面。

51是基础,这点毋庸置疑,只要有人指引,入门可以很快很快很快,嵌入式开发的思想里面全都有。

现在做TMS320F2812和TMS320F28035,原先还可以算是DSP,但是由于偏重控制方面,现在已经归属在MCU范畴里了。

2812:

2812很经典,但是毕竟也老了,就像2407一样,从今年的芯片价格暴涨开始,是时候该被后浪拍在沙滩上了。新生代的处理器一个是向强大的处理能力上发展,一个是向更低的成本方向发展,因此28035应运而生。

28035:

新生代的低成本处理器向小型化,低功耗,供电简单,内置晶振的方向发展,28035完全满足这些要求,并且以CLA为卖点,带来了额外的并行浮点处理核心*。今后的主攻方向就是它了。

*这里的浮点是伪浮点,通过转成定点精度来计算,再转换为浮点数。

DSP:Digital Signal Processors,数字信号处理器

MCU:Micro Control Unit,微控制核心

CLA:Control Law Accelerator,控制率加速器