在2018年的美国中期选举正火热的那段时间,网上传播着一种新型的谣言(misinformation)

这种东西被称为“深度伪造”(deepfakes)

简单来说就是,通过人工高智能技术给视频里的人物换脸;这次中期选举中流传了一些政客的讲话视频,但这些政客其实根本没有拍过这些视频。

Called "deepfakes" after the pseudonymous online account that popularized the technique – which may have chosen its name because the process uses a technical method called "deep learning" – these fake videos look very realistic .
这种技术得名“深度伪造”是因为那个让这种技术广为人知的网络账户的笔名就叫“深度伪造”,之所以取这个名字可能是因为这种东西的制作过程需要用到一种叫“深度学习”的技术——这让这种假视频看起来非常真实。

到目前为止,已经有人用深度伪造来制作嘲讽视频(satire video),你在里面会看到一些名人做他们通常并不会做的滑稽事情。

我们基本可以确定,这种视频在选举的重要节点一定会出现,好让人们以为一些政客讲了他们没讲的话、去了他们没去的地方。

这真的是个大麻烦,由于现在这项技术还非常新,所以绝大部分人根本没办法把它们和真实视频区分开来。

What's a 'deepfake,' anyway?
深度伪造到底是什么?

Making a deepfake video is a lot like translating between languages. Services like Google Translate use machine learning – computer analysis of tens of thousands of texts in multiple languages – to detect word-use patterns that they use to create the translation.
制作深度伪造视频很像是在翻译语言。像谷歌翻译一类的翻译软件在翻译语言时,其实是在用机器学习的技术来分析人们使用语言的一些模式——也就是用电脑分析多种语言的成千上万条文本——并以此创作出翻译。

Deepfake algorithms work the same way: They use a type of machine learning system called a deep neural network to examine the facial movements of one person.
深度伪造算法也是一样的:它们使用一种叫做深度神经网络的机器学习系统来研究一个人的面部动作。

Then they synthesize images of another person's face making analogous movements. Doing so effectively creates a video of the target person appearing to do or say the things the source person did.
然后它们就会合成另一个人的面孔来做出类似的动作。这样可以很有效地让目标人物在视频中做源人物在做的事情。

听起来很高深是不是?

不过它这个技术基础也恰好给我们留下了识别它的方法。

这种深度神经网络若想顺利运作,需要先学习非常多的源信息,比如目标人物的照片。使用的照片越多,其最终的伪造效果就越好。

但是,有一种表情的照片它们几乎是得不到的,那就是闭着眼睛时的表情。

即使是那些每天拍海量照片的人,他们发布出来的也基本都是自己睁着眼睛的照片;闭眼的照片不光很少被照下来,即使照下来了通常也不会发布到网上。

这就让深度伪造的视频出现了一个问题:基本不会眨眼(blink)

Without training images of people blinking, deepfake algorithms are less likely to create faces that blink normally. When we calculate the overall rate of blinking, and compares that with the natural range, we found that characters in deepfake videos blink a lot less frequent in comparison with real people.
由于训练时得不到人们眨眼的照片,深度伪造不太可能做出人们正常眨眼的视频。当你把深度伪造视频里的人和真人做比较,你会发现他们眨眼的频率要小很多。

一个健康的成年人通常每2-10秒就眨一次眼,每次眨眼的时间为1/10到4/10秒;如果你在视频中观察到的是这样,那应该就是真视频,而如果不是这样,那估计就是深度伪造。

 

OK,来讲讲今天的词 Fake

它作形容词讲的时候表示“虚假的”、“伪造的”。

同时它也可以作名词,表示“赝品”。

 

那么,我们来造个句子吧~

All the paintings proved to be fakes.
所有这些画都被证实是假的。