互联网60%的句子由AI生成火眼金睛甄别AI 谷歌加大招开源SynthID 还能为AI生成的多媒体内容参与隐形水印！ Text

2024-11-14

出品 | 技术栈（微信号：blog51cto）

谷歌正在推出其 SynthID Text 技术，让开发者能够对生成式 AI 模型生成的文本启动水印token和检测，并且该技术如今曾经片面放开。

SynthID Text 可以经过 AI 平台 Hugging Face 和谷歌降级后的担任任生成式 AI 工具包下载。

谷歌的这项成绩曾经被nature接纳了！在这篇论文中，谷歌具体揭秘了水印的上班原理。

那么，SynthID Text 终究是如何上班的呢？

一、SynthID的AI查重：哪个“token”最或许出自AI之手

假定给出一个相似“你最青睐的水果是什么？”的疑问，文本生成模型会预测哪个“token”最有或许跟在另一个token之后——逐一token生成。token可以是单个字符或单词，它们是生成模型用来处置消息的基本构件。

以 "我最青睐的热带水果是____"为例。LLM 或许会从 "芒果"、"荔枝"、"木瓜 "或 "榴莲 "等标志词开局实现句子，并为每个标志词调配一个概率分数。当有一系列不同的标志可供选用时，SynthID 可以在不影响输入品质、准确性和发明性的状况下，调整每个预测标志的概率分数。

谷歌示意，SynthID Text 经过“调理生成token的或许性”在这种token散布中拔出了额外消息。

上图：LLM 文本生成通常是经过从左到右生成文本的方式，重复从 LLM 散布中启动采样。下图：生成式水印方案通常由三个组成局部形成，如蓝色框中所示：随机种子生成器、采样算法和评分函数。这些组件可以用于提供一种文本生成方法和水印检测方法。在 SynthID-Text 生成式水印方案中，咱们经常使用的是锦标赛采样算法。

谷歌宣称，自往年秋季以来，SynthID Text 已与其 Gemini 模型集成，并且不会影响文本生成的品质、准确性或速度，即使在文本被裁剪、改写或修正后依然有效。

这种技术可用于少至三句话的内容。随着文本长度的参与，SynthID 的持重性和准确性也会提高。

二、SynthID的多模态停顿：音频、视频也有水印

谷歌示意，经常使用谷歌模型生成的AI音频、视频，也曾经“自带水印”。

1.音频

在音频方面，SynthID 会把 Lyria 模型生成的音频加下水印。

SynthID的技术是，先将音频波（声响的一维体现方式）转换为频谱图。

计算出频谱图后，SynthID会将数字水印参与其中。最后，将频谱图转换回波形。在这一转换步骤中，SynthID 应用音频个性确保人耳听不到水印，从而不会影响听觉体验。水印对许多经常出现的修正（如参与噪音、MP3 紧缩或放慢和减慢音轨）都很持重。

SynthID 还能扫描音轨，检测不同点能否存在水印，以协助确定其中的局部能否由 Lyria 生成。

2.视频

SynthID 将人眼不可发觉的数字水印间接参与到AI图像和视频中。

而且，即使经过各种技术操作，比如裁剪、参与滤镜、扭转色彩、扭转帧频和经常使用各种有损紧缩等，也不可解脱这个水印。

三、写在最后

不过，谷歌抵赖其水印方法存在局限性。

例如，SynthID Text 在处置短文本、改写或从其余言语翻译的文本时体现不佳，或许在处置回答理想性疑问时效果较差。“在回答理想性揭示时，调整token散布的时机较少，且不会影响理想准确性。”这包含像“法国的首都是哪里？”之类的疑问，或许像“背诵威廉·华兹华斯的诗”这样简直没有变动空间的恳求，此类输入很难被识别。

谷歌并不是惟逐一家努力于 AI 文本水印技术的公司。OpenAI 多年来不时在钻研水印方法，但因为技术和商业方面的思考，推延了发布。

假设文本水印技术被宽泛驳回，它可以协助应答日益盛行但经常失误token的“AI 检测器”疑问，这些检测器会失误地将以较为通用的语气撰写的文章或论文token为 AI 生成的。但是，疑问在于，这些技术能否会被宽泛驳回，以及能否有某一组织的规范或技术会胜出。

未来或许会有法律机制迫使开发者驳回这些技术。中国曾经引入了对 AI 生成内容强迫加水印的规则，加利福尼亚州也正方案采取相似措施。

情势十分紧迫。依据欧盟执法机构的一份报告，到 2026 年，90% 的在线内容或许会是由 AI 分解生成的，这将带来关于虚伪消息、宣传、欺诈和诈骗的新执法应战。据 AWS 钻研显示，因为 AI 翻译工具的宽泛经常使用，网络上约 60% 的句子或许曾经是 AI 生成的。

参考链接：

1.

2.

想了解更多AIGC的内容，请访问：

AI.x社区

AI 水印互联网

<<量子计算和人工智能融合如何开启新技术反派

怎样用Docker把多个镜像打包到一个文件中>>

互联网60%的句子由AI生成 火眼金睛甄别AI 谷歌加大招开源SynthID 还能为AI生成的多媒体内容参与隐形水印！ Text