cyqdesign |
2019-10-18 08:31 |
麻省理工卷積神經(jīng)網(wǎng)絡(luò):能恢復(fù)模糊圖像中的清晰信息
據(jù)外媒報道,麻省理工學(xué)院(MIT)的科學(xué)家們找到了一種可以在運動模糊的視頻幀中恢復(fù)細(xì)節(jié)并重現(xiàn)清晰圖像的方法。這套“視覺投影模型”通過使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來解碼圖像。 oa1a5+A c/2OR#$t MIT計算機(jī)科學(xué)和人工智能實驗室(CSAIL)的研究人員通過掃描數(shù)千對圖像(投影)訓(xùn)練CNN,其中一幅圖像質(zhì)量較低,另一幅圖像則圖像模糊。神經(jīng)網(wǎng)絡(luò)利用這些信息然后通過學(xué)習(xí)像素模式和像素來源從本質(zhì)上逆轉(zhuǎn)模糊效果。 @3S2Xb{ra1 %e1vq CNN的另一部分責(zé)備稱為“變分自動編碼器(variational autocoder)”,它能夠分析輸出并評估網(wǎng)絡(luò)跟信號的匹配程度。隨后,它則會創(chuàng)建一幅“藍(lán)圖”告訴AI如何對一個投影到所有可能的匹配源進(jìn)行處理。當(dāng)給定一幅新圖像時,CNN會檢查像素模式并使用該藍(lán)圖尋找可能導(dǎo)致模糊的每個信號,然后它組合數(shù)據(jù)創(chuàng)建一個“高維”副本。 );|~4# ?0;b}Xl-
打個比方,在一段顯示一輛汽車飛馳而過的視頻中你可能能分辨出那輛車是紅色的,但除此之外其他的信息則都不清楚。而視覺投影模型可以獲取這些素材并創(chuàng)建一個足夠清晰的復(fù)制品來識別制作和模型。 !P92e1 I@L-%#@R1 這篇論文的首席作者、CSAIL的博士后Guha Balakrishnan表示:“對于我們能夠恢復(fù)這些細(xì)節(jié)就像變魔法一樣! iZyk2kc {Ue6DK% 實際上,研究人員對它在醫(yī)學(xué)領(lǐng)域的作用更感興趣。他們相信這項技術(shù)可以被用來制造類似于X射線CT的3D掃描。這一突破將能顯著降低成本,因為MRI和CT設(shè)備都非常昂貴。該軟件將能夠從成本相對較低的X射線等低信息圖像中重建出高信息圖像。 Z21XlbK KuI>:i; “如果我們能將X射線轉(zhuǎn)換成CT掃描,那將在某種程度上改變游戲規(guī)則,”Balakrishnan說道,“你只需拍一張X光片,然后通過我們的算法就能看到所有丟失的信息!
|
|