AI影像真假難辨

Posted on 2019/08/12 in 人工智慧, 倫理, 媒體識讀 with 沒有迴響 1,234 views

AI影像真假難辨
撰文／Larry Greenemeier｜譯者／甘錫安
轉載自《科學人》2018年5月第195期

人工智慧的新技術已能製作唯妙唯肖的假照片。

假照片和攝影技術的歷史差不多同樣久遠，花仙子和尼斯湖水怪的照片就是著名例子。Photoshop軟體把影像處理帶進了數位時代，現在人工智慧（AI）讓影像變造技術更上一層樓。人工神經網路可分析數百萬張真人和景物影像，並以此做出幾可亂真的偽造影像。

受到人類大腦構造所啟發，人工神經網路是由許多人工神經元互相連接所構成。多年來，谷歌，臉書等公司都使用人工神經網路協助其軟體辨識出影像中的人。有種新方法稱為「生成對抗網路」（GAN），其中包含產生影像的生成（generator）網路和評估影像真實程度的鑑別（discriminator）網路。總部位在美國西雅圖的艾倫人工智慧研究所執行長伊茲奧尼（Oren Etzioni）說：「人工神經網路需要用幾百萬張範例影像來學習，GAN這種新方法則可自動產出這類範例。」

GAN也可以快速產生逼真的假影像。生成網路經由機器學習去研究大量影像，可製作出唯妙唯肖的虛構影像，接著把這些影像送往鑑別網路。鑑別網路能夠辨識出影像中的人，並可評估生成網路產出影像的真實程度。經過一段時間，生成網路變得更擅長製作假影像，鑑別網路也更擅長判定，這種網路因而稱為「對抗網路」。

GAN之所以能稱為AI的重大突破，在於它經過初步訓練後就可繼續學習，不需要人類監督。現任職於谷歌大腦（該公司的AI計畫）的研究科學家古德費洛（Ian Goodfellow）在2014年的論文裡介紹此方法，他是第一作者。此後，全世界許多研究人員嘗試把GAN用於機器人控制或語言翻譯等方面。

開發這類無人監督的系統是一大挑戰.GAN有時不會隨著時間而精進，如果生成網路無法產出越來越真實的影像，鑑別網路也無法持續進步。

晶片廠商輝達（Nvidia）已開發出訓練GAN的方法，有助於避免GAN學習受阻這種方法的要點是同時漸進訓練生成網路和鑑別網路：先輸入低解析度影像，再隨訓練進程逐步加入新的像素層，添加高解析度細節。輝達的研究人員於今年4月的國際AI研討會上發表論文指出，這種漸進式的機器學習策略可縮減一半的訓練時間。研究團隊展示這項技術的方法是，以20多萬張名人影像的資料庫來訓練GAN，GAN產出完全虛構但栩栩如生的高解析度臉部影像。

GAN並不知道製作的照片是否逼真。參與此計畫的輝達研究人員雷提農（Jaakko Lehtinen）說：「我們選擇臉孔當成主要範例，原因是人類可以輕易判斷AI生成模型的成效。我們天生具有辨識臉孔的神經機制，生活中又不斷訓練及學習辨識臉孔。」這項挑戰在於如何讓甘模仿人類的直覺。

臉書公司認為鑑別網路可依據使者的過往行為，協助臉書更準確預測使用者想看的內容，終極目標是創造具備常識的AI。該公司AI研究院院長楊立昆（Yann LeCun）和研究工程師欽塔拉（Soumith Chintala）表示，他們理想中的系統「不僅要能辨識文字和影像，還要具有推論，預測和計畫等較高階的功能，足以比擬人類的思考和行為。」楊立昆和欽塔拉測試該公司生成網路的預測功能時，輸入影片前四幀（frame）畫面，由生成網路產生接續兩幀，最後合成出連續動作的影片，例如人在行走或擺頭的動作。

對需要低成本內容的製片人和遊戲創作者而言，栩栩如生的AI生成影像和影片極具價值。AI研究公司OpenAI研究人員拉德福（Alec Radford）評論道，即使GAN能產出「貌似真實」的影像，但要做到毫無瑕疵仍需努力。拉德福於2016年在國際AI研討會上發表的論文正是臉書目前工作的基礎，他是該文的第一作者。他補充道，要製作出高品質AI生成影片，還早得很。

人們是否會把AI產生的影像或影片用在線上惡搞等不當行徑上，還待觀察。此刻，大眾越來越懷疑線上內容的真實性，這類技術的問世恐怕只會雪上加霜。

延伸閱讀：真偽莫辨的人像產生器

(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)