1月5日,國家互聯(lián)網(wǎng)信息辦公室公開發(fā)佈了第三批深度合成服務(wù)算法備案信息的公告,達闥旗下基礎(chǔ)大模型算法和RobotGPT多模態(tài)具身大模型算法正式通過了備案,其中,RobotGPT多模態(tài)具身大模型是國內(nèi)已經(jīng)獲得備案的機器人具身智能大模型。這不僅標志著達闥在人工智能領(lǐng)域研究和開發(fā)上取得階段性成果,更是對公司未來拓展應(yīng)用場景、提升競爭力的有力支撐。
達闥基礎(chǔ)大模型算法:引領(lǐng)自然語言處理技術(shù)創(chuàng)新
達闥基礎(chǔ)大模型算法是公司自主研發(fā)的基礎(chǔ)大模型,主攻自然語言理解、自然語言生成和自然語言處理等領(lǐng)域,為對話問答類企業(yè)端客戶提供高效服務(wù)。通過結(jié)合上下文信息,該算法能夠根據(jù)用戶提出的問題生成相應(yīng)的文本回答,為用戶提供全新的自然語言交互體驗。
RobotGPT多模態(tài)具身大模型算法:國內(nèi)已經(jīng)獲得備案的具身智能大模型
具身智能是能理解、推理、並與物理世界互動的智能系統(tǒng),是人工智能的下一個浪潮。具身智能中的智能體要以第一人稱身份融入周邊環(huán)境,擁有感知、認知、決策和行動的全面能力,像人類一樣自主處理任務(wù)。而大模型的「通用認知性」可使具身智能機器人具備強大的特徵學(xué)習(xí)和泛化能力,通過強大的雲(yún)端計算支持,應(yīng)對複雜任務(wù)及決策,進一步實現(xiàn)對任務(wù)場景的拆解和思維鏈能力,因此,大模型是具身智能機器人的不可或缺之選。這就是RobotGPT多模態(tài)具身大模型所做的工作。
繼基礎(chǔ)大模型后,達闥于去年7月推出了機器人領(lǐng)域人工智能大模型——RobotGPT多模態(tài)具身大模型,它是達闥專為實現(xiàn)機器人在不同複雜場景中的多模態(tài)行為而打造的具有高級交互生成能力的具身智能大模型,不僅整合了強大的語言生成和處理功能,還融入了情感分析、視覺語言導(dǎo)航、視覺語言操作、表情動作生成、自主行為決策等多模態(tài)輸入輸出功能。
這種集成化設(shè)計使得RobotGPT不只是一個簡單地回答問題或者進行文本創(chuàng)作的AI系統(tǒng);它實際上已經(jīng)跨越到讓機器人可以在真實世界中進行任務(wù)分解、自主導(dǎo)航、抓取物體等操作。
RobotGPT利用深度強化學(xué)習(xí)技術(shù)來處理並整合來自各種傳感器(如攝像頭、麥克風(fēng))收集到的多種類型信息,並結(jié)合預(yù)訓(xùn)練大模型所提供的廣泛知識庫來做出決策。它的推理能力不僅僅是基於預(yù)訓(xùn)練的知識,還能夠利用歷史經(jīng)驗進行適應(yīng)性學(xué)習(xí)。這樣一來,它就可以根據(jù)用戶給出的指令或者遇到新情境時快速調(diào)整行為策略。
該技術(shù)背後還涵蓋著幾個關(guān)鍵模型:
大語言模型:負責(zé)處理自然語言輸入輸出,支持開放式問答和內(nèi)容創(chuàng)作。
開放域檢測視覺大模型:使機器人可以識別並理解其所處環(huán)境中對象及場景。
機器人導(dǎo)航與抓取大模型:賦予機器人空間移動和精確操控物體的能力。
基於深度強化學(xué)習(xí)專家小模型:優(yōu)化特定任務(wù)執(zhí)行過程中遇到挑戰(zhàn)時所需採取行動。
達闥推出的RobotGPT標志著AI從純粹數(shù)據(jù)驅(qū)動向真正意義上具備「身體」(具身智能)的轉(zhuǎn)變——即從桌面端軟件走向移動性與交互性更強且更加接近於生命體驗方式運作方式轉(zhuǎn)變。這一技術(shù)產(chǎn)品的推出,不僅為企業(yè)端客戶提供了更加智能化的服務(wù),也為機器人技術(shù)的創(chuàng)新與應(yīng)用開闢了新的道路。
深度應(yīng)用多領(lǐng)域,助推千行百業(yè)數(shù)字化、智能化發(fā)展
RobotGPT多模態(tài)具身大模型的應(yīng)用領(lǐng)域十分廣泛,已成功落地能源電力、醫(yī)療健康、金融保險、交通樞紐等十多個重點行業(yè),並支持百余個客戶場景的應(yīng)用。在電力領(lǐng)域,它能夠提供知識問答、多輪對話等智能服務(wù);在醫(yī)療健康領(lǐng)域,它助力自主服務(wù)和病理推斷;在金融保險行業(yè)中,它通過分析語音和行為來精準評估風(fēng)險;而在交通樞紐如機場和地鐵中,該模型訓(xùn)練調(diào)優(yōu)生成機場、地鐵服務(wù)類大模型,在滿足機場、地鐵等知識問答的同時,賦能各種類型的服務(wù)和功能機器人,完成複合型和個性化業(yè)務(wù),提高服務(wù)運營質(zhì)量。
去年9月,憑藉強大的場景落地能力,「RobotGPT多模態(tài)大模型賦能千行百業(yè)」案例也獲得了由國家工業(yè)信息安全發(fā)展研究中心發(fā)起的《「智賦百業(yè)」2023年人工智能融合發(fā)展與安全應(yīng)用典型案例》【領(lǐng)航型】獎項,受到了行業(yè)的關(guān)注和認可。
此次備案的通過,不僅標志著達闥RobotGPT多模態(tài)具身大模型在技術(shù)上的成熟,也意味著達闥的大模型技術(shù)受到國家政策的支持和鼓勵。這將為達闥在雲(yún)端機器人領(lǐng)域的發(fā)展提供更大的助力,加速機器人在各領(lǐng)域的應(yīng)用落地,進一步推動行業(yè)的快速發(fā)展。
RobotGPT的使命是「賦能千行百業(yè)、引領(lǐng)具身智能」。未來,達闥將依託「雲(yún)端機器人-國家新一代人工智能開放創(chuàng)新平臺」,進一步推動RobotGPT大模型的創(chuàng)新和應(yīng)用,助力企業(yè)級客戶獲得AI能力和實現(xiàn)更長線的增長,促進人工智能產(chǎn)業(yè)的健康發(fā)展。