微軟近日宣布,視覺Agent解析框架OmniParser已發(fā)布最新版本V2。這一新版本具有將大型語言模型如OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)以及Anthropic(Sonnet)等,轉(zhuǎn)化為“計算機使用智能體”(Computer Use Agent)的能力。
與前一版本相比,OmniParser V2在檢測更微小、可交互的元素時展現(xiàn)出了更高的精度和更快的推理速度。這一顯著提升得益于V2采用了更大規(guī)模的交互元素檢測數(shù)據(jù)集和圖標(biāo)功能描述數(shù)據(jù)進行訓(xùn)練。通過這些訓(xùn)練,OmniParser V2能夠更好地理解和識別計算機界面中的各種元素,從而為用戶提供更加智能、便捷的操作體驗。
此外,OmniParser V2還通過縮小圖標(biāo)描述模型的輸入圖像尺寸,進一步降低了推理延遲。據(jù)微軟透露,與前代版本相比,V2的推理延遲降低了60%,這意味著用戶可以更加迅速地獲得系統(tǒng)的響應(yīng)和反饋。
微軟OmniParser V2的發(fā)布,標(biāo)志著大型語言模型在計算機使用智能體領(lǐng)域的應(yīng)用取得了重要進展。
- 
                                微軟
                                +關(guān)注
關(guān)注
4文章
6706瀏覽量
107172 - 
                                計算機
                                +關(guān)注
關(guān)注
19文章
7741瀏覽量
92511 - 
                                大模型
                                +關(guān)注
關(guān)注
2文章
3391瀏覽量
4855 
發(fā)布評論請先 登錄
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片
【作品合集】賽昉科技VisionFive 2單板計算機開發(fā)板測評
微軟正式發(fā)布Microsoft行星計算機專業(yè)版
自動化計算機經(jīng)過加固后有什么好處?
    
在V2板子上部署豆包模型調(diào)試指南
一文帶你了解工業(yè)計算機尺寸
    
求助,關(guān)于LT8625SP在LTPOWERCADII V2中的疑問求解
軟通計算機重磅發(fā)布DeepSeek大模型一體機產(chǎn)品
    
機智云發(fā)布Gokit5 AI智能體開發(fā)板:工業(yè)級智能體流水線重構(gòu)AIoT開發(fā)范式
    
微軟OmniParser V2發(fā)布:大模型轉(zhuǎn)化為計算機智能體
云端超級計算機使用教程
工業(yè)中使用哪種計算機?
    
量子計算機與普通計算機工作原理的區(qū)別
    
工業(yè)計算機類型介紹
    
          
        
        
微軟OmniParser V2:大模型轉(zhuǎn)化為計算機智能體
                
 
           
            
            
                
            
評論