东港瑞宏基于国产AI大模型的具身智能机器人助力数字政务应用场景新革命

2023-06-26 14:49:15

“未来会有猫女造型的女性机器人。”马斯克在给特斯拉系列汽车进行宣传的时候,经常会提及“猫女”这个话题,他曾经发布了一张带有“猫女”轮廓的照片,并且还向大众承诺一定会制造出这样的机器人,不但可以永葆青春、美丽、性感,会做饭、不吵架、不离婚、不分财产,甚至还会生孩子。虽说这还是人们对未来的期望,但事实上在国内能够产业落地的AI大模型与实体机器人的结合早已初露端倪。

“具身”智能机器人进入产业爆发前夜

2022年以来,AI大模型技术的持续突破正在加速“具身人工智能”这一进程,在大模型方向,OpenAI最新发布的GPT-4能够赋予机器人高质量的连续对话能力;在机器视觉方向,META发布的SAM模式有望助力机器视觉迎来GPT时刻,使其做到“能听、能看、能说”,随着人工智能技术的不断成熟,具身智能机器人逐渐成为科技领域的热门话题,海外科技巨头及国内各大厂商都在抢跑具身智能机器人赛道。

具身智能机器人是一种具备自主决策和行动能力的机器智能,它可以像人类一样感知、理解和行动。具身智能机器人的发展可以提供更多的智能化应用场景,拓展更多的智能化服务,提升服务的质量和效率,实现产业智能化转型。

大模型、AIGC为具身智能机器人突破技术瓶颈提供新思路

AI人工智能的发展趋势不会改变,其中的技术瓶颈也将会快速被突破。ChatGPT,GPT-4,引发了AI界的全民狂欢,文生图类应用如StableDiffusion、Midjourney以及DALL·E2也开始快速流行。

进入AIGC时代,GPT等AI大模型为机器人场景应用提供了新的解决方案,ChatGPT可以类比原有的对话式AI应用、AI赋能的搜索类应用。AIGC则可以分为生成文本、生成图像、生成视频,即通过将图像、文字、具身数据联合训练,并引入多模态输入,增强模型对现实中对象的理解,将多模态的大语言模型作为人类与机器人沟通的桥梁,帮助机器人处理具身推理任务。

AI大模型与税务AI大模型融合,东港智能机器人已率先落地场景应用

AI应用升级迭代可能会从优先具备海量数据的场景开始。东港股份有限公司下属子公司东港瑞宏就已联合中关村RFC机器人联盟头部企业上海归墟电子、北京康力优蓝机器人、深圳锐曼机器人联合打造首款政务系统专用智能机器人-“小瑞”,并将其成功应用于政务大厅场景,为公众提供更加便捷、高效的服务

网站-图1.jpg

公司作为国内首批开展电子发票试点的企业,建设了国内首家电子发票平台,并于2013年6月27日开出了国内首张电子发票,2014年实现首张可入账报销的电子发票,在2020年3月在北京开出首张区块链电子发票,是国内电子发票的创造者和引领者,公司建设完成具有“国家等保三级”的数据中心。

2022年东港组建人工智能技术研发团队,重点研究人工智能技术自动生成内容(AIGC)和自然语言处理(NLP)技术,目前已结合国产化大语言模型在政务智能机器人领域应用。

东港与中关村双创智能服务机器人联盟核心企业上海归墟、康力优蓝、锐曼机器人等相关企业联合升级研发的服务型智能机器人—“小瑞”已经基于专属域AI大模型在政务服务领域得到以下应用:

1.全流程仿人模拟服务:“小瑞”可以通过学习政府机构的信息和服务流程,为公众提供有关政府机构的信息查询和服务申请。例如,在政务服务大厅“小瑞”可以为公众提供从进厅到柜台再到离厅的业务办理指引服务、业务办理选择和取号服务,以及在迎宾模式下的智能接待、自动讲解等工作。

2.深层多模态交互信息的搜集与分析:“小瑞”还可以通过对公众的语言和行为进行分析,为政府机构提供更加个性化的服务。例如,当公众在政府机构的网站或社交媒体上留言时,“小瑞”可以通过智能大脑的情感分析和自然语言生成技术,快速准确地回复用户,并提供相应的服务建议。

3.快速响应的决策支持与建议:“小瑞”还可以通过对政府机构的数据进行分析,为政府机构提供更加有效的决策和管理支持。例如,当政府机构需要了解公众对某项政策的反应和意见时,“小瑞”可以通过语言模型的文本挖掘和机器学习技术,快速准确地分析公众的言论和情感,并向政府机构提供相关的分析报告和建议。

4.具身智能优势下的自主移动与环境交互:“小瑞”还可以通过自主导航和视觉识别技术,巡视政务服务大厅内的各个区域,监测并及时处理公众的问题和需求。例如,当公众在某个窗口排队等候时,“小瑞”可以通过视觉识别技术,快速准确地判断窗口的排队情况,并提醒工作人员及时处理。

终极载体——具身智能与机器人的深度融合

为了确保“小瑞”能够在各行业场景中发挥最大的作用,东港与上海归墟、康力优蓝、锐曼机器人等行业老兵共同优化升级完成最新的机器人硬件载体,该款机器人基于国内领先的大语言模型,具身智能、通用智能体和类脑智能等通用人工智能新路径,紧贴实际应用场景推动具身多模态智能系统研究及应用,突破了机器人在开放环境、泛化场景、连续任务等复杂条件下的感知、认知、决策技术,具备跨模态、跨语言的深度语义理解与生成能力,亦可广泛与数字人电商、元宇宙、智能大脑等解决方案形成互动互补。

网站-图2.jpg

东港的政务专属域AI大模型是一种先进的大语言模型,具有强大的自然语言处理和学习能力。基于大语言模型的智能机器人-“小瑞”在政务服务领域应用具有广泛的应用前景和重要的意义,可以为政府机构和公众提供更加高效、精准的服务。

不同于传统机器人仅具有“物理”执行力 ,“小瑞”机器人操作系统是能够理解、推理并与物理世界互动的智能系统,可通过将图像、文字、具身数据联合训练,引入多模态输入,进而提升大模型和环境的交互能力和学习能力,为机器人注入了“灵魂”。

依靠视觉识别和计算机学习的高精度导航系统,拥有图像、视觉、视频、深度学习等多种高性能处理器,能够同时实时地处理数十种算法,用于传感器处理、测距、定位绘图、视觉感知以及路径规划,让机器人能够从传感器获取输入、定位自身、感知环境、识别并预测附近物体的运动、推理出合理动作并安全执行。

多模态具身视觉语言模型,不仅能够理解图像,还能理解、生成语言,执行各种机器人指令而无需重新训练,让“小瑞”能够准确地识别用户的身份信息和需求。

3D人体动作捕捉系统,使得“小瑞”能够像真人一样在大厅中自如行走、与人交流。

更值一提的是,此次“小瑞”基于通用语言大模型做的对话能力升级,可以说从语音、视觉、决策、控制等多方面实现人机结合,强大的对话能力背后是全球首个基于隐空间的生成式开放域,加之强大的知识图谱积累,多任务训练方案能使得机器人化身百事通,更好地适应人类生活场景,满足衣食住行娱全方位问询需求。

作为一款最先融入AI大模型的量产级人形机器人产品,“小瑞”不仅展示了东港集团与机器人行业联盟的技术融合,更为多个行业领域带来了前所未有的变革可能,包括金融、医疗、教育、电商等,在未来的日子里,我们有理由相信,“小瑞”将会在各行各业中发挥重要作用,为政务大厅、法院、展馆、医院、银行、机场、商场、体育场等数百个行业场景打造人工智能解决方案及服务推动商用服务智能化升级,同时通过全链条运营、全场景服务的应用接入、效能增强与体验提升,实现AI的长期商业价值挖掘与客户服务体验提升。

上一篇:十年与电子发票共发展     下一篇:东港瑞宏&普华永道中国:携手推进企业数字化升级