2022年人工智能圖像技術(shù)取得長足進(jìn)步
2022年,人工智能(AI)繼續(xù)在多個領(lǐng)域取得長足進(jìn)步,但最大沖擊之一可能是AI模型的出現(xiàn)。這些模型可以根據(jù)簡單的描述性文本生成像照片一樣逼真的圖像。
![]() 可以讓人們分享AI代碼和數(shù)據(jù)集的Hugging Face網(wǎng)站的創(chuàng)建人之一托馬斯·沃爾夫說:“要我說,這在2021年底還是完全出人意料的事! 在2022年前,這種將文本轉(zhuǎn)化為圖像的AI還是一項(xiàng)相當(dāng)不成熟的技術(shù),其作品很粗糙。但到了今年,技術(shù)迅猛發(fā)展,以至于在今年美國科羅拉多州博覽會的美術(shù)競賽上獲獎的作品之一就是AI創(chuàng)作的。 英國伯明翰大學(xué)的馬克·李說,在硬件和軟件優(yōu)化的共同作用下,這項(xiàng)技術(shù)迅速發(fā)展。首先,研究人員開始將谷歌公司工程師2017年發(fā)明的一種名為轉(zhuǎn)換器的算法用于生成圖像。最初,此類AI模型被用于構(gòu)建像“生成型已訓(xùn)練變換模型3”(GPT-3)這樣的文本生成模型。 其次,硬件功能變得非常強(qiáng)大:在將大量顯示卡轉(zhuǎn)化為統(tǒng)一、高效的超級計(jì)算機(jī)方面不斷取得進(jìn)步。這種超級計(jì)算機(jī)適合完成像訓(xùn)練AI模型這樣的任務(wù),這使它們成為性價(jià)比明顯更高的選項(xiàng)。 但李說,或許最重要的是,擁有訓(xùn)練這些模型的資金和資源的大公司開始免費(fèi)提供部分研究成果,甚至向更大范圍內(nèi)的公眾提供有限的使用機(jī)會。 李說:“人們原本預(yù)計(jì)這些大公司會完成所有這些工作,然后將成果據(jù)為己有,并靠它們賺錢。但將成果提供給更廣泛的群體很有遠(yuǎn)見,因?yàn)槿绻@樣做的話,就會有更多科學(xué)家涉足這個領(lǐng)域! 沃爾夫說,盡管轉(zhuǎn)換器模型在圖像生成方面取得了初步進(jìn)展,但一種名為擴(kuò)散的新型算法最近幾個月一直處于領(lǐng)先地位。 他說:“轉(zhuǎn)換器能發(fā)揮作用,但它們往往會提供一些怪異的作品。擴(kuò)散模型與轉(zhuǎn)換器截然不同,它們能夠創(chuàng)作出具有精細(xì)紋理的作品。我認(rèn)為,正是這一點(diǎn)讓這種新模型在達(dá)到‘令人贊嘆的’效果方面脫穎而出。” 事實(shí)證明,這些AI已經(jīng)帶來了混亂。文學(xué)網(wǎng)站和雜志主編、圖書封面創(chuàng)作者阿德里安·亞歷山大·梅迪納說,AI已經(jīng)搶走了他的傭金,客戶現(xiàn)在選擇免費(fèi)生成的圖片,而不是付錢給人類創(chuàng)作者。 他說:“我和他們討價(jià)還價(jià)……他們最終卻換了一個方向,去購買或創(chuàng)作他們自己的、AI生成的封面。錢是他們的,他們有特權(quán)。不過,這確實(shí)令人沮喪和惱火! 照片授權(quán)公司“快門存儲”與研究機(jī)構(gòu)開放人工智能公司甚至簽署了一份協(xié)議。根據(jù)該協(xié)議,客戶可以付費(fèi)使用最新模型并按要求生成圖像——梅迪納把這比作“下水道的水漏到飲用水中”。 更令人惱火的是,AI模型必然都接受過海量數(shù)據(jù)集的訓(xùn)練,這些數(shù)據(jù)集包括從互聯(lián)網(wǎng)上獲取的海量圖片。有人已經(jīng)建了一個網(wǎng)站,允許人們搜索這些數(shù)據(jù)集,以尋找他們的作品已被納入這種服務(wù)的證據(jù)。例如,如果你搜索《新科學(xué)家》就會發(fā)現(xiàn),該刊此前的數(shù)百個封面已被納入其中。 用人工智能創(chuàng)作定制藝術(shù)品所需的成本和時(shí)間將大幅減少,這最終可能會對人類創(chuàng)作者產(chǎn)生巨大影響。梅迪納說:“一個人(利用人工智能)只花幾個小時(shí)就能生成幾十件作品,并將它們發(fā)給那些要么分不清好壞、要么根本不關(guān)心的客戶! (《新科學(xué)家》周刊,《2022年,人工智能讓把一切繪制成圖成為可能》,作者:馬修·斯帕克斯) 原文鏈接:https://www.newscientist.com/article/2349037-ai-made-it-possible-to-create-a-picture-of-almost-anything-in-2022/ |