另類AI評測標準走紅,。隨著人工智能視頻生成技術的發(fā)展,一個有趣的現(xiàn)象逐漸流行起來:每當有公司發(fā)布新的人工智能視頻生成器時,總會有人用它來制作威爾·史密斯吃意大利面的視頻,。這不僅成了網(wǎng)絡熱梗,還成為了衡量新型AI視頻生成器性能的一種非官方標準,,檢驗其能否逼真地呈現(xiàn)威爾·史密斯狼吞虎咽吃面的畫面,。今年二月,,威爾·史密斯本人也通過Instagram發(fā)布了一段模仿視頻,,親自加入了這場網(wǎng)絡狂歡,。
“威爾·史密斯吃意大利面”只是2024年人工智能領域眾多奇特非官方評測標準之一。此前,,一位16歲的開發(fā)者開發(fā)了一個應用程序,,讓人工智能控制《我的世界》游戲,以此測試其建筑設計能力。同時,,一位英國程序員創(chuàng)建了一個平臺,,讓人工智能在“你畫我猜”和“四子棋”等游戲中相互對戰(zhàn)。
盡管存在更多學術化的性能測試,,但這些略顯怪異的測試卻迅速走紅,。原因在于許多行業(yè)標準的人工智能基準測試對普通人來說過于晦澀難懂。企業(yè)經(jīng)常標榜其人工智能在奧林匹克數(shù)學競賽或博士級別難題中的解題能力,,而大多數(shù)人使用聊天機器人只是為了聊天或回復電子郵件,。
即使是行業(yè)內(nèi)普遍采用的評測方法,,也未必更有效或更具信息量,。例如,“聊天機器人競技場”允許任何網(wǎng)絡用戶對AI在特定任務上的表現(xiàn)進行評分,,如創(chuàng)建網(wǎng)頁應用程序或生成圖像,。然而,參與評分的用戶往往不具有代表性,,他們大多來自人工智能和科技行業(yè),,并且他們的投票基于個人偏好,難以捉摸,。
像“四子棋”,、“我的世界”和“威爾·史密斯吃面條”這類奇特的人工智能基準測試顯然不是嚴謹?shù)膶嵶C研究,甚至不具備普遍適用性,。即使AI能夠完美生成“威爾·史密斯吃面條”的視頻,,也不意味著它能很好地生成漢堡的圖像。
這些另類的AI基準測試可能在短期內(nèi)不會消失,,因為它們不僅具有娛樂性,,而且易于理解。未來幾年,,或許會有更多新奇的基準測試出現(xiàn),。
榮耀Magic7系列搭載了強大的YOYO智能體,通過一句話即可完成許多操作,,如點奶茶,、查詢自動續(xù)費等。AI的強大不僅體現(xiàn)在這些便捷功能上,,還表現(xiàn)在影像處理能力上
2024-11-11 19:46:13榮耀Magic7Character.AI,,一家以創(chuàng)新技術和個性化服務著稱的AI聊天機器人公司,,近期宣布與科技巨頭谷歌達成了一項重要的合作協(xié)議
2024-08-04 14:10:53硅谷新潮流:創(chuàng)始人賣掉自己2024年10月,vivo X200的發(fā)布成為科技界的一大亮點,。這部手機融合了卓越性能,、獨特設計和多樣功能,迅速吸引了消費者的關注,。接下來,,我們將深入分析vivo X200的各項特性
2024-10-15 14:17:50如何評價vivoX200今年上半年,,奇瑞品牌在SUV市場占有率中拔得頭籌,,瑞虎家族對此貢獻顯著
2024-08-08 22:51:37試駕評測奇瑞瑞虎8L