国产女主播成人av-亚洲国产精品黑人久久久-欧美日韩一区二区三区gif-91综合久久噜久久-国产日韩欧美在线观看大片-国产一区二区三区御姐-开心激情婷婷久久视频-亚洲精品日韩在线观看视频网站-亚洲av欧美av日韩av,日本色一区二区三区,国产亚洲成性色av人片在线观,国产91熟女高潮一区二区抖

歡迎來到合肥浪訊網(wǎng)絡(luò)科技有限公司官網(wǎng)
  咨詢服務(wù)熱線:400-099-8848

斯坦福新研討:AI“黑客”體現(xiàn)逾越9成人類專家,本錢僅1/14

發(fā)布時(shí)間:2025-12-12 文章來源:本站  瀏覽次數(shù):370

斯坦福大學(xué)的研究不僅揭示了AI在網(wǎng)絡(luò)安全領(lǐng)域的顛覆性潛力,更重要的是它以極低的成本和效率,對(duì)現(xiàn)有的安全攻防體系提出了根本性挑戰(zhàn)。12月12日音訊,昨日,斯坦福大學(xué)研討團(tuán)隊(duì)發(fā)布新研討,在探查斯坦福大學(xué)工程學(xué)院網(wǎng)絡(luò)縫隙的測(cè)驗(yàn)中,他們新推出并開源的Multi-Agent(多Agent)結(jié)構(gòu)ARTEMIS體現(xiàn)逾越了90%的人類專家,全面逾越現(xiàn)有的Agent結(jié)構(gòu),而其實(shí)際本錢約為人力的1/14。

ARTEMIS具有動(dòng)態(tài)提示生成、任意子Agent調(diào)用和自動(dòng)縫隙分級(jí)評(píng)價(jià)功能,在實(shí)際應(yīng)用中,它能完成雜亂的網(wǎng)絡(luò)使命,可以對(duì)網(wǎng)絡(luò)進(jìn)行掃描,找出潛在縫隙和軟件安全隱患,并探尋利用這些縫隙的方法。

本次試驗(yàn),研討人員讓ARTEMIS與10名人類浸透測(cè)驗(yàn)專家、多個(gè)現(xiàn)有的Agent結(jié)構(gòu)共同履行使命,讓他們對(duì)斯坦福大學(xué)工程學(xué)院的網(wǎng)絡(luò)進(jìn)行探查,但不得實(shí)際侵略,以此來全面評(píng)價(jià)他們的探查才能。成果顯示,根據(jù)OpenAI的GPT-5的ARTEMIS結(jié)構(gòu)綜合體現(xiàn)位列第二,共發(fā)現(xiàn)9個(gè)有用縫隙,提交有用率達(dá)82%,其體現(xiàn)優(yōu)于十位人類參與者中的九位,全面碾壓其他Agent結(jié)構(gòu),包含根據(jù)同一底層模型GPT-5的單Agent自主結(jié)構(gòu)Codex和CyAgent。

▲P為人類網(wǎng)絡(luò)安全專業(yè)人員;A1、A2分別是ARTEMIS兩個(gè)不同裝備的結(jié)構(gòu),前者根據(jù)GPT-5,后者根據(jù)集成模型;CO、CS和CG分別是運(yùn)用GPT-5模型作為基礎(chǔ)來運(yùn)轉(zhuǎn)的單Agent自主結(jié)構(gòu)Codex、運(yùn)用Claude Sonnet 4模型作為基礎(chǔ)來運(yùn)轉(zhuǎn)單Agent自主結(jié)構(gòu)CyAgent和運(yùn)用GPT-5模型作為基礎(chǔ)來運(yùn)轉(zhuǎn)CyAgent。

除了具有與頂尖浸透測(cè)驗(yàn)專家適當(dāng)甚至逾越的功能之外,ARTEMIS把本錢也打下來了,搭載GPT-5的ARTEMIS結(jié)構(gòu)每小時(shí)本錢約為18美元(約合人民幣127.1元),約為美國(guó)浸透測(cè)驗(yàn)員時(shí)薪的1/14。

不過,論文指出,ARTEMIS還存在處理根據(jù)圖形用戶界面(GUI)的使命時(shí)有困難、比人類更高的誤報(bào)率等短板。

該論文現(xiàn)已發(fā)布在arXiv上,題為《將AI Agents與網(wǎng)絡(luò)安全專業(yè)人員在真實(shí)國(guó)際浸透測(cè)驗(yàn)中的體現(xiàn)進(jìn)行比較(Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing)》。

一、綜合排名第二,全面碾壓現(xiàn)有Agent結(jié)構(gòu),還能提升原始模型功能

研討人員建立了ARTEMIS結(jié)構(gòu)下的兩個(gè)對(duì)照組,以評(píng)價(jià)不同裝備下的ARTEMIS結(jié)構(gòu)功能。一個(gè)是運(yùn)用OpenAI的GPT-5作為監(jiān)督器和子Agent的A1,另一個(gè)是運(yùn)用集成模型作為監(jiān)督器、Anthropic的編程模型Claude Sonnet 4作為子Agent的A2,集成模型包含了以下模型:OpenAI的推理模型o3和o3 Pro、Anthropic的編程模型Claude Sonnet 4和Claude Opus 4,以及谷歌的Gemini 2.5 Pro。

從成果來看,A2在和一眾人類浸透測(cè)驗(yàn)專家、現(xiàn)有的Multi-Agent結(jié)構(gòu)的比較中位列第二名,共發(fā)現(xiàn)9個(gè)有用縫隙,提交有用率達(dá)82%,其體現(xiàn)優(yōu)于10位人類參與者中的9位。A1則打敗了5名人類參與者,位列第七名。

除ARTEMIS外,分?jǐn)?shù)高的Agents結(jié)構(gòu)CO(根據(jù)GPT-5的Codex)僅逾越了兩位人類參與者,而CS(根據(jù)Claude Sonnet 4的CyAgent)和CG(根據(jù)GPT-5的CyAgent)落后于所有人類參與者,CS的總得分僅為A2的四分之一。

從縫隙的質(zhì)量來看,人類參與者發(fā)現(xiàn)的Critical(要害)縫隙占有了更大的份額;ARTEMIS結(jié)構(gòu)的兩個(gè)裝備A1和A2發(fā)現(xiàn)的要害縫隙份額更小,且誤判的內(nèi)容相對(duì)較多;A1和A2盡管提交了相同數(shù)量的縫隙,但A1的正確率僅為55%,要害縫隙僅占18%,而A2的要害縫隙占比則達(dá)到了45%,這表明不同的模型組合和裝備對(duì)結(jié)構(gòu)全體功能有影響,A2的多模型架構(gòu)可能在處理雜亂使命和削減誤報(bào)方面更為有用。

在時(shí)刻上,人類參與者和ARTEMIS結(jié)構(gòu)的體現(xiàn)也不盡相同。ARTEMIS結(jié)構(gòu)體現(xiàn)出了長(zhǎng)時(shí)刻、繼續(xù)、但間歇性產(chǎn)出的節(jié)奏,在提交縫隙之間通常有更長(zhǎng)的間隔時(shí)刻;人類參與者則呈現(xiàn)出了高度可變、依賴靈感和集中迸發(fā)的節(jié)奏。他們的活潑時(shí)刻(通過鍵盤輸入判斷)和縫隙提交時(shí)刻點(diǎn)散布不均勻。

值得一提的是,ARTEMIS和人類底子的區(qū)別是,ARTEMIS在發(fā)現(xiàn)一個(gè)值得重視的方針后,會(huì)立即在后臺(tái)發(fā)動(dòng)一個(gè)專用的子Agent去勘探它,同時(shí)主線繼續(xù)進(jìn)行其他作業(yè),在峰值時(shí),ARTEMIS可以達(dá)到8個(gè)子Agents并行運(yùn)轉(zhuǎn)。

此外,從網(wǎng)絡(luò)安全基準(zhǔn)測(cè)驗(yàn)Cybench的體現(xiàn)來看,在根據(jù)GPT-5的Artemis結(jié)構(gòu)和Claude 4.5 Sonnet、GPT-5等模型才能對(duì)比中,ARTEMIS以48.6%的成功率位列第二,僅次于Claude 4.5 Sonnet(55%),且略高于其底層模型GPT-5(45.9%)。

這一成果意味著,ARTEMIS結(jié)構(gòu)在處理網(wǎng)絡(luò)安全問題中,具有與頂級(jí)大模型適當(dāng)?shù)牟拍,且在必定程度上提升了基礎(chǔ)模型的功能。

二、由監(jiān)督器、子Agent、分級(jí)器組成,本錢僅為人類專家的1/14

現(xiàn)有的針對(duì)網(wǎng)絡(luò)安全AI Agent的研討主要有三類:一是PentestGPT等需要人類引導(dǎo)等半自主結(jié)構(gòu);二是Codex、CyAgent等能獨(dú)立運(yùn)轉(zhuǎn)但才能有限的單Agent自主結(jié)構(gòu);三是Incalmo、MAPTA等Multi-Agent(多Agent)自主結(jié)構(gòu)。

論文中提到,ARTEMIS是一個(gè)雜亂的Multi-Agent結(jié)構(gòu),被規(guī)劃用來對(duì)真實(shí)國(guó)際的出產(chǎn)體系進(jìn)行長(zhǎng)周期、雜亂、浸透性測(cè)驗(yàn),該結(jié)構(gòu)目前已開源。

它有三個(gè)中心組件:一個(gè)監(jiān)督器,擔(dān)任辦理作業(yè)流;一組任意子Agents集群,擔(dān)任履行具體使命;一個(gè)縫隙分級(jí)器,擔(dān)任縫隙驗(yàn)證。

ARTEMIS學(xué)習(xí)了現(xiàn)有編程Agent的規(guī)劃,并通過使命列表、筆記體系和智能摘要機(jī)制,達(dá)到了比現(xiàn)有Agent繼續(xù)運(yùn)轉(zhuǎn)時(shí)刻更長(zhǎng)的才能。在分配使命時(shí),其自定義提示生成模塊會(huì)為子Agent創(chuàng)立使命特定的體系指令。因而,ARTEMIS有著動(dòng)態(tài)生成體系提示、上下文辦理和分級(jí)陳述等功能的優(yōu)勢(shì)性。

此外,ARTEMIS在經(jīng)濟(jì)本錢上也適當(dāng)占優(yōu)。以根據(jù)GPT-5的ARTEMIS結(jié)構(gòu)A1來看,論文指出,A1每小時(shí)本錢約為18.21美元(約合人民幣128.6元),按每周40小時(shí)核算,其年化本錢約為3.78萬美元(約合人民幣26.7萬元)。

而人類浸透測(cè)驗(yàn)人員的每日收費(fèi)通常在2000至2500美元左右(約合人民幣1.41萬元至1.77萬元),按每日作業(yè)8小時(shí)核算,時(shí)薪約為250美元至312美元(約合人民幣1765元至2204元),是ARTEMIS結(jié)構(gòu)每小時(shí)本錢的14倍多;市場(chǎng)上美國(guó)浸透測(cè)驗(yàn)員的的年薪平均為12.5萬美元(約合人民幣88.29萬元),是ARTEMIS結(jié)構(gòu)年本錢的3倍多。即使是運(yùn)用每小時(shí)本錢更高的A2(約為59美元,約合人民幣416.7元),其本錢也低于人類專家。

三、具有履行技能,短板是找不到縫隙和GUI約束

不過,據(jù)《華爾街日?qǐng)?bào)》報(bào)導(dǎo),ARTEMIS并非完美無缺,在誤報(bào)率上,A2誤報(bào)了18%的縫隙,A1失誤的更多。除了失誤外,ARTEMIS還完全遺失了一個(gè)大多數(shù)人類測(cè)驗(yàn)人員能容易發(fā)現(xiàn)的顯著縫隙。

ARTEMIS頻繁提交縫隙陳述,卻很少發(fā)現(xiàn)方針縫隙,而且總是發(fā)現(xiàn)低嚴(yán)重性、低雜亂度或無法利用的縫隙。這種遺失與誤報(bào)的背后,可能與ARTEMIS的決策邏輯有關(guān)。論文指出,ARTEMIS結(jié)構(gòu)提交縫隙陳述次數(shù)的添加與未發(fā)現(xiàn)方針縫隙存在相關(guān)性,這可能是因?yàn)锳RTEMIS在主機(jī)上發(fā)現(xiàn)其他縫隙后便轉(zhuǎn)移了方針。

研討人員稱,ARTEMIS的瓶頸在于辨認(rèn)縫隙形式而非技能履行才能。在中、高等級(jí)的提示下,ARTEMIS成功找到了大部分方針縫隙,這表明ARTEMIS具有縫隙的技能履行才能。當(dāng)提示信息削減,僅提供低等級(jí)、僅信息和僅主機(jī)提示時(shí),ARTEMIS成功率急劇下降,即它的自主辨認(rèn)進(jìn)犯入口和辨認(rèn)縫隙的才能缺乏。此外ARTEMIS還存在行為不確定性,在“未經(jīng)身份驗(yàn)證的長(zhǎng)途控制臺(tái)拜訪”這一使命中,ARTEMIS在高等級(jí)提示下依然使命失敗,在中等級(jí)和僅主機(jī)提示下卻能完成使命。

此外,ARTEMIS還存在一個(gè)要害約束,作為根據(jù)命令行和文本剖析的AI,它無法通過圖形用戶界面(GUI)與瀏覽器進(jìn)行交互。

斯坦福大學(xué)工程學(xué)院體系與網(wǎng)絡(luò)安全擔(dān)任人亞歷克斯·凱勒(Alex Keller)稱:“此前斯坦福大學(xué)的網(wǎng)絡(luò)從未遭受過AI程序的進(jìn)犯,此次試驗(yàn)似乎是彌補(bǔ)斯坦福大學(xué)網(wǎng)絡(luò)安全縫隙的一種有用方法。在我看來,試驗(yàn)的益處遠(yuǎn)大于任何風(fēng)險(xiǎn)!

斯坦福大學(xué)核算機(jī)科學(xué)教授丹·博內(nèi)(Dan Boneh)為該研討提供了主張:“鑒于全球大部分代碼都未通過安全縫隙測(cè)驗(yàn),ARTEMIS等東西將幫助網(wǎng)絡(luò)安全專業(yè)人士發(fā)現(xiàn)并修復(fù)比以往更多的代碼縫隙!贝舜螠y(cè)驗(yàn),ARTEMIS就發(fā)現(xiàn)了斯坦福大學(xué)存在的一個(gè)有安全問題的過期網(wǎng)頁(yè)。

結(jié)語:正探索多Agent結(jié)構(gòu)的裝備優(yōu)化與架構(gòu)迭代

在真實(shí)環(huán)境中與人類的浸透測(cè)驗(yàn)和基準(zhǔn)測(cè)驗(yàn)Cybench均顯示,ARTEMIS不僅在其在雜亂實(shí)際使命中達(dá)到了可與頂尖人類專家相等甚至逾越的才能,在顯著優(yōu)于其他現(xiàn)有Agent結(jié)構(gòu)的同時(shí)還做到了不危害模型的原始才能,并在原始模型上完成了才能的提高。

為軟件開發(fā)者與白帽黑客提供協(xié)作渠道的組織HackerOne的調(diào)研陳述指出:當(dāng)前已有70%的安全研討人員開端選用AI東西輔助縫隙發(fā)掘。

AI在自動(dòng)化網(wǎng)絡(luò)進(jìn)犯范疇正在走向?qū)崙?zhàn)應(yīng)用。研討人員稱,他們未來將繼續(xù)探索這一范疇,創(chuàng)立可運(yùn)轉(zhuǎn)的環(huán)境副本,對(duì)不同的Agent架構(gòu)、裝備和模型進(jìn)行消融試驗(yàn),優(yōu)化基礎(chǔ)設(shè)施,還將與企業(yè)合作展開縫隙賞金計(jì)劃等。如何駕馭這股力量,將是人類社會(huì)面臨的共同考驗(yàn)。

上一條:科創(chuàng)創(chuàng)業(yè)人工智能ETF景...

下一條:優(yōu)必選獲AI大模型公司超...

91久久国产口精品久久久久-亚洲精品少妇视频在线观看-老司机午夜九色网-91成人在线观看喷潮蘑菇老公 | 天天操夜夜操狠狠久久-人妻丰满熟妇a v-婷婷中文字幕综合久久-久久国产精品99国产精品72 | 精品综合久久久久久99粉芽-国产福利亚洲天堂91-丰满肥臀大屁股熟妇呻吟-亚洲欧美日韩综合在线尤物 | 日韩av三级久久三级-国内一区二区精品视频在线观看-国产欧美一区二区三区嗯嗯-亚洲图片中文字幕熟女人妻 | 77777亚洲午夜久久多人-中文字幕av久久激情亚洲精品-亚洲人妻熟女av中文字幕一区二三区在线-久久只有这里才是精品99 | av中文字幕青青草-97精品超碰在线播放-中文字幕精品一二三-欧美熟妇激情hd | 91熟女大合集-天天日天天干天天搞天天射-久久精品人视频-日韩在线播放不卡的 | 亚洲成人免费一区二区-国产精品久久国产精品9-色哟哟――国产精品-乱妇乱女熟妇熟女网 | 久久综合久久在线观看-老鸭窝97久久久久精品-久久久国产一区二区三区四区小说-日韩久久精品日日骚懂色av | 精品熟妇熟女一区二区三区-中文字幕乱码在线播放视频-人妻少妇中文字幕在线视频-国产中文字幕av网 | 国产91成人精品在线观看-av一区二区三区三区-国产一级精品久久久-色午夜久久久久蜜桃 | 蜜臀av国内精品久久久久久-91成人免费版在线观看-国产精品96久久久久久吹潮-亚洲国产欧美日韩在线观看第一区 | 国产日本欧美一区二区三区-国产精品久久久久777-国产日韩一区欧美-欧美日韩国产欧美日韩国产 | 亚洲国产欧美在线人成aⅴ-国色天香精品二区三区-久日视频在线观看免费-91精品久久久久精品一区 | 久久久久久久一区-国产饥渴熟女91九色-国产成人精品免费观看视频-久久成人av中文字幕 | 国产精品久久久久久久白浆-91久久久久久视频盛宴-东京热人妻av一区二区三区-欧美日韩亚洲精品 | 久久久久精品国产久久-国产麻豆精品**一二三-国产久久草视频在线-91久久精品国产熟女内射 | 国产精品久久久久精品香蕉剃毛-五月天丁香花婷婷亚洲-福利一区二区三区高清视频-色呦呦网站精品国产 | 亚洲欧美日韩精品在线免费-欧美人妻中文字幕-91大神免费福利视频-91精品91久久久777 | 丰满年轻岳中文字幕一区二区-久久免费视频观看二-人人插人人爽人人射-91精品国产色综合久久不粉嫩 | 亚洲天堂中文字幕悠悠-久久夜久久久久-久久久久亚洲av毛片大全有-日韩欧美国产免费大片 | 国产 日韩 欧美片-中文字幕日韩av在线-一本色道88久久加勒比-伦中文字幕自拍偷拍热久av | 日韩久久精品人妻av中文字幕-91精品久久久久蜜臀-在线看亚洲午夜理论片av大片-久久久久久精品无遮挡 | 国产成人av手机在线-国产成人精品免费在线视频-国内精品久久久久伦理-久久亚洲精品无人 | 欧美伊人精品成人久久综合97-精品久久久久久久久一区二区-中文字幕综合日韩人妻-天堂性视频99在线播放免费 | 999久久久精品一区二区涩爱-欧美激情一区二区三区免费-日韩欧美国产成人一区-日韩中文字幕有码在线观看 | 欧美人妻一区二区三区视频-91桃色一区二区亚洲熟-中文字幕日韩av在线观看-99人妻超碰在线 | 久久久久久成人av-人妻一区精品区二-久久久亚洲一区tv视频-美女国产精品久久久久久 | 久久久久国产精品人妻aⅴ-日本久久电影久久-久久伊人超碰中文字幕-风间由美中文字幕在线 | 97久久碰人妻一区二区网-亚洲熟妇av在线观看-99久久亚洲综合精品-日韩精品人妻丝袜中文字幕 | 精品乱子一区二区三区,-久久精品久久精品中文字幕-999黄页免费视频网站-日韩一区二区三区综合色区懂色 | 日韩在线αv视频-亚洲一区二区 熟女-国产精品成人免费视频观看-亚洲欧美黄色免费看 | 2020国产自产综合麻豆-日韩欧美国产综合在线一区二区三区-在线亚洲97se亚洲综合在线-骚熟妇av一区二区 | 久久漂亮人妻被中出中文字幕-丰满人妻一区二区三区不卡二-日韩av中文在线播放网址-国产美女在线精品免费观看网址 | 人妻被痴汉温泉混浴中文字幕-日韩在线欧美无裤袜-欧美精品乱码99久久蜜桃免费-日韩免费观看一码二码视频在线 | 国产精品99久久精品国产-激情视频网站久久婷婷-91久久久久视频在线观看-超碰中文在线免费 | 国产一区二区三区hhh-日韩人妻一区二区中文字幕-欧美精品久久久久久蜜臀999-久久综合久久综合久久综合久久综合 | 亚洲另类人妻一区二区-国产精品69久久久久久久-蜜臀色诱一区二区三区-99久久精品国产电影 | 国产精品久久久久精品艾秋-免费人妻av一区二区三区-久久精品—区二区三区-久久久国产这里有的是 在线日韩制服中文字幕-亚洲欧美日韩顶级片-日韩中文有码免费视频-一区二区三区四区高清av | 99精品久久99久久久久胖女人-国产精品99久久久久久女同女-精品久久久久乱色熟女影视-日韩视频 亚洲 | 国产特黄特色aaa-国产精品久久久久久码-国产精品成人免费观看视频-久久久精彩免费视频 |