另外是算法本身的影響?!斑@可能是無(wú)法完全避免的,由深度學(xué)習(xí)算法本身的缺陷決定,,它存在內(nèi)在對(duì)抗性?!蓖踅饦虮硎?,目前最流行的神經(jīng)網(wǎng)絡(luò)不同于人腦的生物計(jì)算,模型由數(shù)據(jù)驅(qū)動(dòng),,和人類的認(rèn)知不具有一致性,。基于深度學(xué)習(xí)的框架,,必須通過(guò)當(dāng)前訓(xùn)練數(shù)據(jù)擬合到目標(biāo)函數(shù)。在這個(gè)框架之下,,如果機(jī)器要識(shí)別狗,,它會(huì)通過(guò)狗的眼睛、鼻子,、耳朵等局部特征進(jìn)行可視化識(shí)別,,而這些可視化特征卻能給想利用深度學(xué)習(xí)漏洞的人機(jī)會(huì),后者可以通過(guò)偽造數(shù)據(jù)來(lái)欺騙機(jī)器,。
除了人訓(xùn)練機(jī)器的數(shù)據(jù)本身有偏差以外,,機(jī)器通過(guò)對(duì)抗性神經(jīng)網(wǎng)絡(luò)合成的數(shù)據(jù)也可能有問(wèn)題。由于機(jī)器不可能“見(jiàn)過(guò)”所有東西(比如識(shí)別桌子,,機(jī)器不可能學(xué)習(xí)所有長(zhǎng)短寬窄各異的桌子),,人也不可能標(biāo)記所有數(shù)據(jù)。如果研究者輸入一個(gè)隨機(jī)的噪音,,機(jī)器可以向任何方向?qū)W習(xí),。這是一把雙刃劍,機(jī)器也可能合成一些有問(wèn)題的數(shù)據(jù),,學(xué)習(xí)時(shí)間長(zhǎng)了,,機(jī)器就“跑偏”了。
數(shù)據(jù)的均衡或可減少“跑偏”
不少科學(xué)家以“garbage in, garbage out”來(lái)形容“數(shù)據(jù)和人工智能的關(guān)系”,。中科視拓(北京)科技有限公司CEO劉昕說(shuō):“對(duì)機(jī)器學(xué)習(xí)而言,,進(jìn)什么就出什么。監(jiān)督學(xué)習(xí)就是讓模型擬合標(biāo)簽,,比如訓(xùn)練者把帥哥都標(biāo)記成‘渣男’,,那么機(jī)器看到劉德華,,就會(huì)認(rèn)為他是……”談到諾曼引發(fā)的討論,劉昕表示:“不需要擔(dān)心,,人類本身就有各種歧視和偏見(jiàn),,用人類生產(chǎn)的數(shù)據(jù)訓(xùn)練AI,再批判AI不夠正直良善,,這么說(shuō)有點(diǎn)危言聳聽(tīng),。”
偏見(jiàn),、刻板印象,、歧視都是人類社會(huì)的痼疾,有些流于表面,,有些深入社會(huì)肌理,,無(wú)法輕易剝離。在這樣的語(yǔ)境中產(chǎn)生的數(shù)據(jù),,攜帶著大量復(fù)雜,、難以界定、泥沙俱下的觀點(diǎn),。如果研究者沒(méi)有意識(shí)到或著手處理這一問(wèn)題,,機(jī)器學(xué)習(xí)的偏見(jiàn)幾乎無(wú)解。真正的“公正算法”或許是不存在的,。