当前位置: 模型材料 >> 模型材料发展 >> 电子行业深度报告人形机器人元年或将开启,
(报告出品方/作者:天风证券,潘暕、许俊峰)
1.人形机器人元年或将开启,MobileALOHA+IsaacAMR重塑行业生态人形机器人商业化元年或将到来,“AI+软硬件”供给准备充足。工信部印发的《人形机器人创新发展指导意见》指出人形机器人有望成为继计算机、智能手机、新能源汽车后的颠覆性产品;MarketsandMarkets预计到年,全球人形机器人市场规模达亿美元,复合增长率为63.5%,市场发展广阔。为争夺这一迅速增长的市场,主要厂商积极推进相关产品的迭代升级和量产落地,人形机器人的商业化条件已然具备。核心技术瓶颈加快突破,AI助力机器人具形化。长期困扰人形机器人智能控制升级发展的主要有三个问题:(1)模仿学习能力:强调AI泛化能力,基于对于人类动作的模仿,人形机器人应具备自主决策、自主学习升级的能力,提升任务完成的完整性和连贯性。(2)末端执行能力:强调灵巧机器手的操作精度,在中央分析器“大脑”的运算决策下,人形机器人的动作输出应精准、降低失误率,提升任务完成的正确性和准确性。(3)基于感知的运动控制能力:强调底盘的全地形移动能力,类似自动驾驶,人形机器人应基于对周围环境的感知实现对自身的运动控制,增强全移动操作能力,提升任务完成的时效性。MobileALOHA系统和IsaacAMR平台分别针对软件算法和硬件开发提出解决方案,攻克人形机器人三大难题,降本增效,加速人形机器人量产实现。
1.1.斯坦福:MobileALOHA助力人机协同训练,模仿学习取得重大突破
人形通用机器人元年或将开局,MobileALOHA到来宣示AI赋能机器人迫在眉睫。MobileALOHA是基于Transformer端到端学习模型,通过ACT动作学习算法模仿人类双手动作的远程操作系统,在已有的静态ALOHA数据集上,利用共同训练,助力机器人完成需要精确操作的任务;达到人类模拟50次演示、机器人相同动作执行成功率超过80%的优良效果,而成本仅为同类系统的10%-20%。MobileALOHA在做家务方面表现出较大的潜能,人形家务机器人雏型初现。近日,走红全网的斯坦福炒菜机器人MobileALOHA展现出AI赋能下低成本实现机器人商业化的可能。MobileALOHA不仅可以自主操作,还可以支持全身远程操控完成洗衣、浇花、煮咖啡等复杂任务,更可以通过神经网络自行学习双手操作的日常行为,充分完成做菜、使用柜子存放物品、与人击掌等个性化的挑战任务,在家政领域方面潜能突出,或成为人形机器人家用化的“拐点”。
我们认为,MobileALOHA系统的优势在于共同训练和模仿学习,其将助力机器人在得到人类演示的数据基础上,自主寻找不同任务的对应最优解,并在不同任务的执行中不断提高操作的精准性与灵敏性,为人形机器人运用在更多场景上创造可能。人形机器人可广泛应用于家政、工业、医疗等诸多行业,行业下的细分场景对机器人的需求往往会存在差异。如要广泛适应不同场景,则会带来较高的研发成本,同时造成部分场景下功能冗余、使用效率低。MobileALOHA通过开源实现“完全复刻”,赋予使用者以低成本在较短的时间内自由训练机器人,来满足个性化的需求,使得其应用空间更具想象力、灵活性,为人形机器人量产使用做好准备。
1.1.1.技术沿革:ACT提升模仿学习能力,ALOHA解决成本高昂问题
机械手臂的运动控制能力,是制约人形机器人普适性和灵活性发展的关键因素。这也是MobileALOHA开源项目的独特性和技术含量所在,利用直接的“模仿学习”方法,让机器人“模仿”人类,低成本地解决操作训练和灵敏度问题,以ALOHA硬件的形式辅助AI的协同训练与决策精准度。机器人类人操作训练方法多样,模仿学习的性价比优势突出。模仿学习:即从人类提供的演示中进行模仿学习,这种“行为克隆”可以让机器人学习各种原始的技能,从简单的拾放操作,到更精细的操作等等,无需庞大数据库储备用于训练AI大模型,在训练成本和训练周期上具有较大优势。
ACT方法利用强化学习助力模仿学习简单化、易操作,增强机器人多场景应用性。MobileALOHA团队先期开发的ACT(ActionChunkingwithTransformers)强化协同学习与模仿学习的结合,通过训练直接映射人类动作的端到端模型,无需整体建模,就可以训练人形机器人,使得普通人也可以在较短的时间内远程操纵MobileALOHA机器人完成未训练过的任务,并达到专家水平。
灵巧手以人手的结构和功能为模仿对象,在提升机器人柔性和易用性中发挥极为重要的作用。灵巧手作为机器人的末端执行器之一,是机器人与环境相互作用的最后环节,其性能的优劣在很大程度上决定了整个机器人的工作性能。目前由系统工程师、研发人员针对具体应用进行的工艺分析、节拍分解、工位设计等复杂自动化系统的设计与集成,机器人操作过程的编程与仿真等工作集中由多指灵巧手实现,将极大地简化系统复杂度和设计难度。
ALOHA机械臂系统实践软件性能,二指夹持更具稳定可靠。斯坦福MobileALOHA团队基于ACT方法开发出硬件ALOHA机械臂,采用已有多轮技术验证的二指夹持器和连杆传动方式,操作稳定性强、运动可靠性高。末端执行器上,外购ViperX6-DoF机械臂,在牺牲一定灵活性的基础上极大节约成本和便利维护,单价仅.95美元,实现模块化组装、工作载荷克、工作精度5-8mm等好处;传动方式上,采用传统的连杆传动,由可调节的尼龙扣感知人手指的运动和动力,借由刚性连杆传递至机械两指,结构设计紧凑,能实现抓取大型物体的功能;灵巧手上,选取可靠的二指夹持器,抓取等运动稳定。
1.1.2.团队构成:联手GoogleDeepMind,软硬件开发能力强
谷歌DeepMind成员加盟,赋能团队机器学习更具前瞻性。斯坦福MobileALOHA团队的两个项目共同负责人都同时在谷歌的核心人工智能研究部门——DeepMind从事研究工作,项目导师亦在谷歌另一核心人工智能研究部门——GoogleBrain(谷歌大脑)担任重要研究岗位。DeepMind致力于将机器学习和系统神经科学的最先进技术结合起来,建立强大的通用学习算法。
SAC-X调度辅助控制算法早已布局,助力ALOHA从零开始学会控制。早在年,DeepMind提出了全新强化学习算法ScheduledAuxiliaryControl,通过学习范式克服传统强化学习对任务相关知识的依赖,鼓励机器人主动调度,并在得到“奖励”后更有效地自主探索其感应空间并设计解决方案。这一算法将帮助ALOHA基于静态数据集进行协同训练的模仿学习,学会各种复杂的任务。
1.2.MobileALOHA:低成本人工智能机器人,新型算法助力高性价比
家庭保姆机器人的“原型机”,潜力广阔的AI自主模仿学习系统。MobileALOHA系统在团队论文中被定义为“一种用于收集双臂运动数据的低成本全身远程操作系统”,本意是开发机器人双臂运动控制的廉价研究平台,但其恰好解决了家务机器人研发的两大难题:1)机器人的运动控制能力:主要是机械手臂的运动控制。MobileALOHA团队利用“静态数据集+模仿学习”联合训练的方法丰富机器人的运动执行样式、提升执行的准确性并增强应对新任务的解决能力,同时开源式设计使得“人人可复刻”,使得普通人也可以在短时间内具备熟练使用的能力。2)机器人的移动能力:主要是机械底座的平稳移动。MobileALOHA团队直接外购市场上成熟的AGV(智能搬运机器人)产品,得益于定位导航、路径规划等技术在上一个十年的普及推广,采用的AgileXTracerAGV有效地解决了机器人在家庭的灵活移动问题。
凸显模仿学习的应用潜力,避免“神话”大模型作用。MobileALOHA系统以“模仿学习”为核心,强调机器直接模仿人类的行为逻辑,降低编程要求,相比需要高算力、强算力支撑的大模型,在训练成本上更具优势,以牺牲一定精准度为代价,简化学习流程、便于普通人上手操作,助力家务机器人早日“走出实验室”。
1.2.1.软件:协同训练与模仿学习方法兼容
感知能力与身体运动能力是通用机器人泛应用的突破口之一,需要打造人形机器人的“小脑”。中国科学院院士、清华大学交叉信息研究院院长姚期智认为“人形机器人需要有一个‘小脑’通过主导视觉、触觉等多种感知,来控制身体,完成复杂的任务”,MobileALOHA团队致力通过协同训练与模仿学习方法打造灵活控制机械双臂的“小脑”。“静态拆解+动态组合”的协同学习方式,增强机器人任务执行的完整性和连贯性。利用协同训练使得机器人从完成静态固定、单一的任务到完成动态移动、连续的任务。已有的静态ALOHA数据集含个演示任务,包括拿起毛巾、拿起杯子、擦拭桌子、擦拭杯子等日常家务操作,将静态数据连续组合便形成动态移动数据来完成整项任务,如完成“清理洒在桌子上红酒”的任务:分解成“导航到水龙头,拿起毛巾,导航到桌子,一只机械臂举起酒杯,另一只机械臂擦拭桌子和杯底”等步骤,循序渐进,帮助机器人在已完成基础上逐步丰富任务的组合并提高任务的难度。
不同模仿学习方法兼容,助力机器人更好理解人类并模仿人类动作。MobileALOHA团队使用多种模仿学习方法与协同训练相结合:1)ACT,强化学习,帮助使用者在完成静态ALOHA数据集以外的任务时,可以通过人类先行使用机械臂示范,将人类动作转化为移动数据,再运用于机械臂从零开始自主尝试,帮助机器人不断扩展使用场景;2)带分块的VINN,从具有最近邻居的演示数据集中检索动作,通过检索动作块而非单个动作,来提升检索性能,防止过度拟合;3)扩散策略(DiffusionPolicy),在生成高清晰度图像方面显示出卓越能力,得益于其在大规模图像-文本对上的预训练,帮助机器人只需要20-50个演示就能学会各种复杂的任务。三种策略方法兼容,既助力机器人提升理解力和执行力,也帮助一般使用者快速上手,训练水准在短时间内接近专家水平。
1.2.2.硬件:基于Tracer移动底座和ALOHA机械臂的全身远程操控系统
低成本实现高性能,在材料价格、操作功能、应用场景上实现完美平衡。MobileALOHA系统以低成本为出发点,尽可能压缩全身操作系统和机械臂等关键部件的成本,并基于底层算法的优势保持良好的性能发挥。硬件系统构成:1)移动底座——1台AGV搬运机器人;2)供电系统——1块1.26kW·h、14kg重的电池;3)控制系统——1台配备英伟达显卡和英特尔i7-H的笔记本电脑;4)运动系统——2对机械臂;5)视觉系统——3个分辨率为x、频率为50Hz的摄像头。基本都通过采购市场上已有的成熟产品,便于模块化组装和后期维修,部件的可靠性也经过了经验,保证整个系统的运行稳定。
价值量最大的三个部分:1)机械臂:采用智能佳ViperX系列机械手臂,配有X系列舵机智能伺服电机,能提供更高的扭矩、更有效的散热和更好的耐用性,系统全开源,用户自由访问温度监控、位置反馈、电压水平、负载和合规设置。2)移动底座:采用AgileXTracerAGV(Tracer)运载机器人移动底盘,移动速度达到1.6m/s,接近人类的平均步行速度;最大有效载荷为千克,高度为17毫米;单价相比同等速度和有效载荷的Clearpath的AGV便宜5倍多。3)控制电脑:采用LambdaTensorbook笔记本电脑,为深度学习公司Lambda和雷蛇合作开发,专用于机器深度学习控制,使用了64GB的DDR4-RAM和2TB的PCIe4.0SSD存储,采用15.6英寸屏幕,具有Hz刷新率。
1.3.灵巧机器手,国内外研究及应用加速增强机器人操作能力
机器人灵巧手作为一种新型的末端执行器,在机器人与环境的交互中起着关键作用。末端执行器是机器人执行部件的统称,一般安装于机器人腕部的末端,是直接执行任务的装置。灵巧手作为一种新型的末端执行器,预期可以实现的拟人化强力抓持、精准抓取和灵活操作能力,具有日趋广泛的应用需求和市场前景。多指灵巧手的机构形式是多指多关节,最普遍的是手指数目为3~5个,各手指具有3个关节,手指关节的运动副都是采用转动副。目前各种协调控制、抓取规划方法被提出以用于控制多指灵巧手实现模拟人手的抓取和操作。
国内外灵巧手研究不断发展,灵活性和感知能力大幅提高。国外研究始于20世纪70年,历经了50多年的发展,从开始简单的机械手发展成现在的高科技人形仿生灵巧手。20世纪末,随着嵌入式硬件的发展,多指灵巧手的研究向着高系统集成度和丰富的感知能力提升的方向发展,进入了快速发展阶段。20世纪80年代后期,国内一些机器人研究机构和部分高等院校也相继开展了机器人多指灵巧手的研究工作。高度系统集成的灵巧手具有灵活性和功能性的优势,但是复杂的系统导致了高额的制造成本并且降低了系统的可靠性和易维护性。因此,近10年,多指灵巧手设计的一个重要方向是简化系统、提高鲁棒性,使其受到干扰仍能保持原有状态。已实现部分量产,国内产品更具性价比优势。目前已有多家公司制造出商品化的机器人多指灵巧手,其销售价格普遍居高。Shadowdexteroushand是英国ShadowRobot公司推出的先进仿人型机器人手,拥有24个自由度和20个可单独控制的自由度,并且可配备指端触觉传感器,是目前最成熟的商品化多指灵巧手之一,报价约30万美元。哈尔滨工业大学-德国宇航中心合作开发的HIT/DLR灵巧手售价在90万元人民币以上,德国SCHUNK公司的SVH五指手报价70万元人民币以上。因时机器人是国内首家实现仿人五指灵巧手商业化落地的企业,也是国内首家可以实现灵巧手量产并将价格降到万元级别水平的企业,其仿人五指灵巧手单手有6个自由度,12个运动关节,基本能够完成人手70%以上的抓取动作,有益于人形机器人低成本量产实现。
灵巧手的发展稳步增长趋势明显,市场需求进一步助推研发。依据仿生学对生物机体环境适应性强、效能高、结构合理等特点进行模拟及研究,灵巧手会越来越接近人手。在航空航天、医疗健康、科学研究等领域,灵巧手的发展将逐步取代人手进行一系列的活动,完成更加精细和危险系数更高的操作。作为机器人与环境相互作用的末端执行机构,灵巧手的研究及发展将继续成为未来机器人领域的研究热点,从而更好助力人形机器人应用于多领域多场景。
1.4.英伟达:IsaacAMR平台,虚拟环境仿真高效率提升机器人移动能力
基于感知的运动控制能力是人形机器人的重要基础,IsaacAMR平台加速机器人的部署效率。英伟达发布的可供第三方进行二次开发的全新自主移动机器人平台IsaacAMR(AutonomousMobileRobot),可用于模拟、验证、部署、优化与管理自主移动机器人,包含了边缘到云的软件服务、计算能力以及一套参考传感器和机器人硬件,可加快AMR的开发和部署速度,减少成本和缩短产品上市时间。虚拟环境算法加速机器人感知能力提升,集成式设计便于机器人大规模生产。软件层面,与斯坦福MobileALOHA团队采用低成本的“模仿学习”方法训练机器人操作能力不同的是,英伟达团队基于IsaacSim创造“逼真的数字孪生”便于AMR机器人的设计,IsaacAMR加快全自主移动机器人的部署并降低成本;硬件层面,采用模块化设计集成NovaOrin,便于研发人员评估系统并改进。
(一)软件层面
Isaac平台将机器人开发分割为训练、仿真测试、构建、部署四个步骤,并融入多项先进技术提升开发、应用效率:训练:通过IsaacReplicator生成的合成数据进行增强,并使用NVIDIATAO工具包进行训练。仿真测试:利用本地和云端提供NVIDIAIsaacSim创建物理精准的逼真环境,对机器人运行相关的各方面进行测试。构建:使用硬件加速SDK(如提供给ROS用户的IsaacROSGEM、用于视频流解析的NVIDIADeepStreamSDK、用于自然语言处理的NVIDIARiva)将AI带入到基于嵌入式系统NVIDIAJetson的机器人。部署:通过EGXFleetCommand和IsaacforAMR(包括Metropolis、cuOpt和DeepMap等)管理机器人编队以优化生产力。
我们认为,Isaac平台为AMR开发带来的主要边际变化在于仿真,一方面通过光线追踪等先进技术提升仿真感知的能力,另一方面通过应用USD格式解决仿真环节中面临的兼容问题。在部署环节,Isaac平台通过多种功能强大的软件包或平台进一步缩短AMR部署所需时间,并强化环境感知、定位和导航等关键能力。我们认为,IsaacSim和功能强大的各种硬件加速SDK相结合,可以帮助用户更有效率地解决机器人开发面临的长尾问题。移动机器人广泛应用于工业、仓储物流、医疗等诸多行业,行业下的细分场景之间对机器人的需求往往会存在差异。以锂电池生产为例,由于应用环境以及具体任务不同,前段工序对机器人运行精度要求非常高,后段工序则需要更好的温度适应性。我们认为大量具备差异化需求的细分场景意味着高昂的机器人研发成本,通过在虚拟环境中进行开发、验证和优化,减少开发成本与开发时间,一款功能完善的仿真器可以帮助AMR机器人应用于更多细分场景。
(二)硬件层面
NovaOrin平台集成多种高性能硬件,为AMR提供了传感器+算力一体化的通用范式。我们认为,AMR的许多应用场景中存在定制化的需求,例如动力电池生产领域对机器人温度适应性要求较高。该通用范式将降低硬件开发门槛,助力开发者将更多资源用于针对性提升服务效率与质量,实现差异化发展。
1.4.1.仿真环节:IsaacSim提升仿真感知能力,USD解决系统兼容问题
IsaacSim较大提升了仿真感知的能力,能够更真实地模拟AMR自主导航等操作。我们认为,IsaacSim为AMR产业带来的主要边际变化之一在于提升了对机器人及环境的图形渲染能力,一个重要的应用就是可以更快速、准确地模拟视觉传感器。
视觉传感器是实现视觉SLAM的关键硬件,而由于图形渲染能力不足,Gazebo等主流仿真系统只具备在简单场景下仿真视觉传感器的功能,一旦场景复杂程度提升,仿真运行速度会急剧降低。视觉传感器仿真的难点在于:1)对图形渲染能力要求较高,且需要同时对多台相机进行渲染;2)需要整合GPU资源,快速解算真实物理模型并同步渲染相机图像和其他传感器信息。
基于RTX平台,IsaacSim可以实时渲染来自传感器的符合物理学的数据。在使用RTX模拟激光雷达时,光线追踪可以在各种照明条件下或者在对反射材料做出反应时提供更加准确的传感器数据;平台还提供许多新的可模拟3D资产包括仓库零件、机器人等,用于建立符合物理学的模拟环境,帮助开发者和用户可以快速开始构建机器人训练虚拟仿真环境。英伟达RTX平台主要包含先进的光线追踪技术以及DLSS(深度学习超级采样)技术,这些技术为IsaacSim的图形渲染能力提供了强有力的支撑。传统的光栅化渲染在呈现设计细节、光影效果逼真、暗部区域表现、反射真实上略显不足;光线追踪技术基于图层进行渲染,一次性处理全局光线,光线可以找到与它相交的一切,因此很容易实现反射、间接光照等全局的照明效果,真实性更强。英伟达在年首次推出了可以商用的光线追踪技术,其主要竞争对手AMD在年才开始应用该技术。英伟达在年也推出了DLSS技术,该技术可以在不影响画质和响应速度的前提下,利用AI创造更多高质量帧。其原理是通过机器学习的方式,以海量游戏中的16K超高分辨率图像作为参考标准进行学习,让AI可以根据有限的画面数据合成出一帧符合目标显示分辨率的画面。光线追踪技术可以提供更真实的光线和图像,而DLSS可以利用AI创造高质量帧,两者结合让RTX实现强大的图形渲染能力。
USD(通用场景描述)提升仿真系统兼容性,优化机器人开发环境。机器人仿真过程往往需要构建不同的环境、导入不同的机器人进行测试,不同环境的软件使用可能冲突。例如ROS开发团队提出的urdf(UnifiedRobotDescriptionFormat)不能表示除了刚体系统之外的复杂场景,Gazebo的开发团队提出SDF(SimulationDescriptionFormat)来表示机器人之外z的环境,但由于ROS和Gazebo始终由开源社区开发运营,缺乏良好的项目组织管理机制,逐渐出现多个版本并存、语法互相冲突等问题,限制其进一步发展。所以机器人仿真器需要提供一种通用的机器人和场景描述文件。英伟达将USD应用于机器人仿真,与其他格式相比,USD的强大之处在于其复用以及兼容能力。一方面,该格式是一个开放、可扩展的框架和生态系统,具有可用于在3D虚拟世界中合成、编辑、查询、渲染、协作和仿真的API,支持在场景创建和资产聚合中实现非破坏性工作流和协作,以便团队可以协同迭代;另一方面,USD与文件系统无关,提供可扩展的资产解析器来支持不同数据源的任何数据存储模型。我们认为USD有助于降低机器人仿真描述文件之间的兼容问题,由于研发人员将可以自由使用并切换各类仿真、设计软件,AMR的开发效率或将进一步提升。
1.4.2.部署环节:Isaac平台强化路径规划等关键技术,缩短AMR部署时间
AMR的一个技术瓶颈在于,如何在有人工和其他车辆(如人工叉车)出入的场景,以及一些需要灵活变化的复杂环境中,使整个系统运行保持高效率。未来,移动机器人需要与人共事,具有自主规划路径的能力,需要在能够自动避障绕行的情况下仍然实现系统的优化调度。这要求调度管理系统能够平衡单体、群体两种智能能力,而机器人本身也需要具备灵活的调整能力。英伟达通过cuOpt和DeepMap等软件(平台)提升AMR路径规划效率、缩短机器人部署时间。(1)cuOpt是打破世界纪录的加速优化引擎。它使用AI帮助开发者设计复杂、实时车队路线规划方案,可用于解决具有多种限制的复杂路线问题,并提供动态路线、作业调度、器人仿真,以及亚秒级求解器响应时间等功能。cuOpt主要有四大优势:a)性能强劲:在10秒内为0个包裹规划行驶路线,在精度相同的环境下比传统方案快倍。b)扩展性强:最多可以横向扩展到0个节点,以完成任务量繁重场景中的计算。NVIDIAcuOpt的性能优于最先进的解决方案,以解决当今无法实现的创新用例。c)准确度高:在GehringHomberger基准测试中以2.98%的误差实现世界纪录的准确性。d)降本增效:可通过动态改道减少15%的行驶时间和燃料成本。
(2)DeepMap在部署AMR时可以访问NVIDIADeepMap平台基于云的SDK,从而将机器人构建大型设施地图的速度从数周缩短到几天,精确度达到厘米级。借助DeepMapUpdateClient,还可实时更新机器人地图。(3)Metropolis是一个图形处理分析平台,可以通过DeepStream、TAO等强大工具将工厂中的大量摄像机等传感器数据转化为有价值的见解。开发者可以直接使用英伟达提供的上百种预训练模型,也可以借助TAO工具套件构建定制化的视觉AI模型,并通过DeepStream在边缘部署,从而加快整体开发速度并实现更出色的实时性能。在AMR的应用中,Metropolis帮助AMR在工厂车间获得额外的情境感知层,从而避开拥挤的区域和盲区,并增强对人员和其他AMR的可见性。
1.4.3.NovaOrin硬件平台提供通用范式,强劲算力保障AMR应用可靠性
英伟达NovaOrin平台为AMR提供传感器与算力一体化服务,集成多种高性能硬件,如同IsaacAMR的“大脑”和“眼睛”。NovaOrin可以为机器人制造商提供工业化配置,减少工程设计资源占用,提高AMR构建、部署可靠性,降低开发成本。NovaOrin提供通用范式,助力AMR行业差异化发展。AMR目前主要应用于工业领域,我们认为,该领域的特点在于各个细分行业之间差异化程度大,壁垒较高。以锂电行业为例,在动力电池生产的后段工序中会涉及高低温测试的环节,厂商需针对移动机器人的温度适应性进行优化;而在锂电前段生产工序中,AMR主要用于为生产线自动运输和对接物料,对移动机器人的需求以高精度举升型为主。NovaOrin平台提供了传感器+算力的通用范式,使AMR企业能集中精力利用自身对行业的深刻认知,针对不同行业特性对产品进一步优化。
AMR定位导航使用同时定位与建图技术(SLAM),可以依靠传感器可实现机器的自主定位、建图、路径规划等功能。根据传感器不同,SLAM主要分为激光SLAM和视觉SLAM两种技术路线。激光和视觉路线都存在自身局限,多传感器结合是未来发展的趋势。激光SLAM依赖激光雷达作为感知设备,构建的地图精度更高,但单机价格高昂且可靠性不足。激光SLAM的定位方式基于轮廓匹配,无法有效解决高度动态的场景变化带来的影响,在特定环境下容易丢失定位。视觉SLAM依赖计算机视觉作为感知手段,能够获得环境的视觉语义理解,在此基础上能够在复杂动态的环境中实现灵活避障、准确定位和高效路径规划,但自身技术成熟度不足、依赖光线且对算力要求高。多种传感器结合可以弥补单一传感器自身存在的缺陷,是未来发展的趋势。
多传感器融合的技术难点主要在于信息冗余和算力不足。如何让AMR在短时间内根据来自多种传感器的大量信息做出正确决策,并满足引入视觉SLAM所带来的更高算力需求,是融合多种传感器的AMR厂商面临的主要问题。英伟达通过提高硬件算力解决了多传感器融合面临的传统问题,并通过软件进一步保障AMR定位建图的可靠性。英伟达NovaOrin平台同时搭载了3个激光雷达和6个摄像头,同时还包含8个超声波传感器用于检测障碍物,2个IMU传感器用于测距,拥有完整的度传感覆盖范围,传感器的多样性和冗余性可以实现Isaac平台中的最新功能并延长运行时间。英伟达在NovaOrin平台中搭载JetsonAGXOrin模组,可以提供高达请务必阅读正文之后的信息披露和免责申明TOPS的AI性能,我们认为该模组在保障视觉传感器等部件需求的同时,可以为AI处理信息、做出决策进行充分的算力支持。
1.4.4.对动态、复杂环境适应能力远超AGV,AMR具备更广阔的应用前景
AMR(自主移动机器人)与传统AGV方案相比智能程度更高,更能适应环境高度动态、复杂的场景,在Isaac平台软硬件双重赋能的背景下,AMR具备更广阔的应用前景。AMR基于SLAM技术,可以即时定位并在现场构建地图,能够实现柔性部署。同时,由于AMR具备自主避障的能力,部署时不需要预设标识规划路线导航,进一步降低部署成本并且可以适应环境动态、复杂的场景。1)动态场景下即改即用:现代制造场景往往是高度动态的,经常需要对产品或产品线进行修改。当需要移动生产单元或添加了新的单元或流程时,更改AGV部署时间久、成本高。AMR可以在现场映射新的地图,从而立即实施新的任务,帮助客户优化生产。2)复杂环境下自主越障:人员流动会使移动场景更加复杂。AGV在遇到障碍物时无法绕行,导致在人员密集的场景中容易引起堵塞。AMR基于多种传感器以及算法,可以分辨障碍物并根据其类别设计绕行路线,从而提升复杂场景下的运行效率。以TCL和灵动科技合作的仓储物流平台为例,该平台主要有以下痛点:1)移动机器人部署改变频繁。由于仓库地点较为分散,且电子产品市场需求变化快、更新换代频繁,对移动机器人的灵活度要求更高。2)环境复杂。工人搬运和自动化设备搬运两种形式同时存在,若移动机器人没有避障功能,物流搬运过程中会出现断流甚至堵塞的情况。且仓库并非简单的点对点传输,涉及多节点交接转送,特别容易出错。灵动科技使用AMR产品切入,利用AMR柔性部署以及自主避障的特性解决平台痛点,提高了经营效率。
2.人工智能成为产业胜负手,核心互联网及工业企业重点布局AI之战打响,核心大企业抓紧布局。ChatGPT等大模型广泛受到
转载请注明:http://www.aideyishus.com/lktp/8487.html