DIY编程器网

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 1580|回复: 0
打印 上一主题 下一主题

[待整理] 具有颜色识别功能的类人机器人设计

[复制链接]
跳转到指定楼层
楼主
发表于 2015-4-27 23:28:00 | 只看该作者 |只看大图 回帖奖励 |正序浏览 |阅读模式
针对传统类人机器人在控制系统实时性和视觉识别方面的不足,以S3C6410作为主控芯片,设计了具有视觉识别功能的类人机器人控制系统,通过改进和简化视频识别算法取得了良好的目标识别效果。实验表明,基于本控制系统设计而成的类人机器人实时性好,目标识别准确,通过调整运动路径能够快速找到目标。
         
          智能移动机器人是近年来发展起来的一门综合学科,涉及机械设计、传感检测、人工智能等多方面知识。类人机器人的控制系统分为三个层次:最上层是机器人的策略规划层,利用各种算法实现各部分的功能;中间一层运行各类应用程序的嵌入式实时操作系统;最底层是硬件平台,通过外围接口获得各类数据、信息。
         
        自主机器人利用传感器获取的信息控制机器人的动作。本文根据武术擂台机器人的实际需要,设计了机器人的控制系统,实现摄像头图像采集、处理和舵机控制等功能。
         
        策略规划层中,由于图像信息具有信息丰富、对场景描述完全的特点,主要通过处理摄像头采集的图像信息实现颜色目标定位。这里采用Linux嵌入式操作系统,由于嵌入式系统资源的限制,要求目标识别算法运行效率高,占用内存空间小。硬件平台主要是控制舵机实现机器人的运动控制。
         
        1 系统控制电路与视频识别算法
         
        1.1 机器人整体架构
         
        在武术擂台技术挑战赛中,机器人要采集目标的位置信息。由于I/O、A/D转换的有效检测距离有限,机器人采用摄像头采集场地上的图像信息,根据目标的颜色进行识别、定位。当检测到目标位置以后控制舵机自主运动向目标靠拢,完成自我介绍、抱绣球等动作。所设计的机器人外形如图1所示。
         
           
          从图中可以看出,机器人头部采用摄像头,通过USB接口与主控板进行连接,用于采集图像信息。机器人腰部、腿部、胳膊各关节利用舵机使其具有一定的自由度,用到的舵机为CDS系列数字舵机。它内部有ATmega8芯片,主控板通过串口与ATmega8通信,就可以实现舵机的控制。针对以上要求,同时考虑系统的实时性,采用S3C6410作为主控芯片。实际控制系统总体框图如图2所示。
         
        1.2 舵机控制系统设计
         
        主控板通过串口1完成与舵机之间的数据通信,舵机控制电路的原理图如图3所示。
         
         
        由于半双工数据线只有一根,所以必须在电路上实现发送和接收上的分离。这里网络Robotis_UART一端直接接到舵机的信号线上,而另一端经过74HC126的两个缓冲器分别与主控芯片的TXD1和RXD1相连,再通过主控芯片使能的方式来确定是发送还是接收数据。主控芯片可以使NLED1为高而NLED2为低,这时TXD1就取得了线路的控制权,主控芯片就可以发送数据到舵机了。反之,当NLED2为高而NLED1为低时,这时RXD1就取得了线路的控制权,这时舵机可以返回数据。
         
        舵机控制的软件方面,需要完成串口的相关配置,主要包括波特率、起始位数、数据位数、停止位数和流控制模式。这里将其配置为波特率19200、起始位1位、数据位8位、停止位1位和无流控制模式。串口的设置主要是设置struct termios结构体的各成员值,如下所示:
           
         
         
        2 图像识别算法
         
        摄像头采集到的图像主要作如下处理:首先对数据解码,利用查表法将RGB空间模型数据转化为HSI空间模型,然后采用类间方差法将图像进行二值化,再利用连通域对目标进行标定,最后对图像进行去噪,从而实现目标的识别和定位。图像处理程序流程图如图4所示。
         
         
        摄像头采集的图像为RGB格式,但RGB模型中R、G、B值易受光线影响,不适宜进行颜色识别;HSI模型中,不同的颜色对应不同的色调参数H,并且H受外界光照影响小,因此采用HSI模型实现颜色识别。因此,要通过某种算法,先将RGB色域空间映射到HSI空间。常用的颜色空间转换算法如下:
         
         
        实现颜色空间转换以后就要根据不同的H值对图像进行二值化处理。二值化的实质是一分类问题,即把一幅图像所含有的0~255的二进制像素按照某个阈值划分成两类。如果阈值设得太低,结果会引入过多的背景信息,但太高就会导致目标信息的丢失。类间方差法(Otsu)、最大熵方法(KSW)和直方图平衡法(Balanced Histogram Thresholding,BHT)是目前应用较广的自动阈值计算方法。
         
        这里采用类间方差法,它的核心思路就是通过最大化类间方差来寻找最佳阈值。假设某一阈值T将整个二值图像分为C0(1,…,T)和C1(T,…,255)两类,则两类的出现概率可以用下式计算:
         
         
        如上所述,最佳阈值的判断标准是使得类间方差最大。于是通过遍历每一个灰度值,并计算其划分带来的类间方差,总能找到一个合适的阈值满足条件。由于式(4)计算二阶中心矩计算量较大,考虑到:
         
         
         
        显然,式(6)只需要计算类内均值,即一阶矩。于是最大化 就转化为最大化式(6)。
         
        接下来的工作就是对图像进行标定,这里所指的标定就是根据二值化后的图像,计算出目标区域的外接矩形位置。在目标构成比较简单的情况下,投影法是效率最高的方法,而当场景中存在多个目标时,多数情况下需要进行连通域计算。拓扑学中把连通性定义为,区域内任意两点之间存在至少一条曲线可以将两者连接。目前的连通域标记方法主要分两类:扫描法和轮廓跟踪法。扫描法的基本思路是逐个检查每个像素的值和连通性,从而获得所有的连通性描述信息,然后根据每点之间的相互关系计算出最后的区域个数和构成关系。基于扫描的连通标记演示如下(以8连通为例):
         
        首先对二值图像进行行扫描得到线段连通标记,如图5所示。然后检查每行之间线段与上一行线段之间的连通关系,并更改标记。
         
         
        第1行:线段1创建标记A。
          第2行:线段2、1之间连通,线段2标记为A;线段3同理标记为A。
          第3行:线段4、2之间连通,线段4标记为A;线段5创建标记为B。
          第4行:线段6、4之间连通,线段6标记为A;线段6、5之间连通,将线段5的标记由B变为A。
          第5行:线段7创建标记B;线段8、6之间连通,线段8标记为A。结果如图6所示。
         
         
        将图像标定完毕可以去掉图像中的噪点,并且找到目标的中心,实现目标的定位。
         
        3 实验与结果分析
         
        将控制卡装到机器人上,控制机器人运动,在运动中摄像头采集图像,并且用方框将目标进行标定。利用上述颜色识别算法对图红色绣球进行标定,得到如图7所示的结果。
         
         
        随着机器人的运动,绣球在图像中的位置发生变化,机器人根据标定结果,就可以得到绣球的位置,根据位置调整自己的运动准确找到绣球。图像采集的速度达到15帧/s,舵机控制准确度达到0.32°,可以圆满完成比赛任务。
         
        结语
         
        本文以S3C6410作为主控芯片,设计了具有视觉识别功能的类人机器人控制系统。改进的颜色识别算法利用查表法、类间方差法、连通域等方法对图像进行处理,取得了良好的视频识别效果。实践证明,由该控制系统的设计方案制作而成的类人机器人,具有良好的自主控制稳定性和较好的视觉识别能力,能够较出色地完成比赛。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 分享分享 支持支持 反对反对
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|文字版|手机版|DIY编程器网 ( 桂ICP备14005565号-1 )

GMT+8, 2024-12-26 10:12 , 耗时 0.090314 秒, 22 个查询请求 , Gzip 开启.

各位嘉宾言论仅代表个人观点,非属DIY编程器网立场。

桂公网安备 45031202000115号

DIY编程器群(超员):41210778 DIY编程器

DIY编程器群1(满员):3044634 DIY编程器1

diy编程器群2:551025008 diy编程器群2

QQ:28000622;Email:libyoufer@sina.com

本站由桂林市临桂区技兴电子商务经营部独家赞助。旨在技术交流,请自觉遵守国家法律法规,一旦发现将做封号删号处理。

快速回复 返回顶部 返回列表