另類(lèi)AI評(píng)測(cè)標(biāo)準(zhǔn)走紅威爾?史密斯吃面成新寵

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-02 07:56:18 搜狐網(wǎng)

另類(lèi)AI評(píng)測(cè)標(biāo)準(zhǔn)走紅。隨著人工智能視頻生成技術(shù)的發(fā)展,，一個(gè)有趣的現(xiàn)象逐漸流行起來(lái)：每當(dāng)有公司發(fā)布新的人工智能視頻生成器時(shí),，總會(huì)有人用它來(lái)制作威爾·史密斯吃意大利面的視頻。這不僅成了網(wǎng)絡(luò)熱梗,，還成為了衡量新型AI視頻生成器性能的一種非官方標(biāo)準(zhǔn),，檢驗(yàn)其能否逼真地呈現(xiàn)威爾·史密斯狼吞虎咽吃面的畫(huà)面。今年二月,，威爾·史密斯本人也通過(guò)Instagram發(fā)布了一段模仿視頻,，親自加入了這場(chǎng)網(wǎng)絡(luò)狂歡。

“威爾·史密斯吃意大利面”只是2024年人工智能領(lǐng)域眾多奇特非官方評(píng)測(cè)標(biāo)準(zhǔn)之一,。此前,，一位16歲的開(kāi)發(fā)者開(kāi)發(fā)了一個(gè)應(yīng)用程序，讓人工智能控制《我的世界》游戲,，以此測(cè)試其建筑設(shè)計(jì)能力,。同時(shí)，一位英國(guó)程序員創(chuàng)建了一個(gè)平臺(tái),，讓人工智能在“你畫(huà)我猜”和“四子棋”等游戲中相互對(duì)戰(zhàn),。

盡管存在更多學(xué)術(shù)化的性能測(cè)試，但這些略顯怪異的測(cè)試卻迅速走紅,。原因在于許多行業(yè)標(biāo)準(zhǔn)的人工智能基準(zhǔn)測(cè)試對(duì)普通人來(lái)說(shuō)過(guò)于晦澀難懂,。企業(yè)經(jīng)常標(biāo)榜其人工智能在奧林匹克數(shù)學(xué)競(jìng)賽或博士級(jí)別難題中的解題能力，而大多數(shù)人使用聊天機(jī)器人只是為了聊天或回復(fù)電子郵件,。

即使是行業(yè)內(nèi)普遍采用的評(píng)測(cè)方法,，也未必更有效或更具信息量。例如,，“聊天機(jī)器人競(jìng)技場(chǎng)”允許任何網(wǎng)絡(luò)用戶對(duì)AI在特定任務(wù)上的表現(xiàn)進(jìn)行評(píng)分,，如創(chuàng)建網(wǎng)頁(yè)應(yīng)用程序或生成圖像。然而,，參與評(píng)分的用戶往往不具有代表性,，他們大多來(lái)自人工智能和科技行業(yè),，并且他們的投票基于個(gè)人偏好，難以捉摸,。

像“四子棋”,、“我的世界”和“威爾·史密斯吃面條”這類(lèi)奇特的人工智能基準(zhǔn)測(cè)試顯然不是嚴(yán)謹(jǐn)?shù)膶?shí)證研究，甚至不具備普遍適用性,。即使AI能夠完美生成“威爾·史密斯吃面條”的視頻,，也不意味著它能很好地生成漢堡的圖像。

這些另類(lèi)的AI基準(zhǔn)測(cè)試可能在短期內(nèi)不會(huì)消失,，因?yàn)樗鼈儾粌H具有娛樂(lè)性,，而且易于理解。未來(lái)幾年,，或許會(huì)有更多新奇的基準(zhǔn)測(cè)試出現(xiàn),。

(責(zé)任編輯：盧其龍 CN070)

關(guān)閉

另類(lèi)AI評(píng)測(cè)標(biāo)準(zhǔn)走紅 威爾?史密斯吃面成新寵

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

另類(lèi)AI評(píng)測(cè)標(biāo)準(zhǔn)走紅威爾?史密斯吃面成新寵