AI 23% 2023-05-09

抖音关于人工智能生成内容标识的水印与元数据规范

China Law Translate chinalawtranslate
Document Text 4,758 characters
人工智能技术的快速发展,为互联网行业带来了更多可能性。  尤其在内容创作领域,生成式人工智能技术降低了创作的门槛,丰富了互联网内容生态,为信息生产和传播带来了新的变革和机遇。  但与此同时,人工智能生成内容存在识别难的特点,也带来了虚假信息、侵权等问题。  <br> <br> 《互联网信息服务深度合成管理规定》明确要求深度合成服务提供者对使用其服务生成或者编辑的信息内容,应当采取技术措施添加不影响用户使用的标识,对于具有生成或者显著改变信息内容功能服务的,应当在生成或者编辑的信息内容的合理位置、区域进行显著标识,向公众提示信息内容的合成情况,避免公众混淆或者误认。  <br> <br> 抖音始终致力于鼓励表达,激发创造,为了提供更好的社区环境,依据《抖音关于人工智能生成内容的平台规范暨行业倡议》我们针对人工智能生成的视频、图片内容发布标识水印规范和元数据规范,希望能够帮助用户和行业在合规合理的范围内更好地使用生成式人工智能技术。  <br> <br> 标识水印规范:旨在帮助AI生成工具和创作者可以使用统一样式和位置,来提示用户内容由AI生成,并尽可能减少因不同水印样式造成用户有不好的观感体验。  <br> <br> 标识元数据规范:通过规范人工智能生成内容的元数据格式,在相关图片和视频元数据中写入信息,达到行业通用识别的效果。  <br> <br> 适用范围<br> <br> 标识水印和元数据规范原则上适用于下述创作工具和内容,符合以下范围的创作工具生成的内容,原则上需要在内容生产阶段嵌入人工智能生成内容标识水印与元数据信息:<br> <br> 创作工具范围:提供生成式人工智能服务能力的创作工具,如文字生成图片、文字生成视频等。  <br> <br> 内容类型范围:通过人工智能生成的图片、视频、音频。  <br> <br>  规范性引用文件<br> <br> GB/T 38548.4-2020内容资源数字化加工 第4部分:元数据<br> <br> GB/T 7408-2005 数据元和交换格式 信息交换 日期和时间表示法<br> <br> GY/T 259-2012 下一代广播电视网(NGB)视频点播系统元数据规范<br> <br> WH/T 51-2012 图像元数据规范<br> <br> WH/T 62-2014 音频资源元数据规范<br> <br> WH/T 63-2014 视频资源元数据规范<br> <br> 术语和定义<br> <br> AI生成:即人工智能生成的内容,指利用人工智能技术,自动生成的视频、图像、文本等内容。  <br> <br> 水印:通过在图像、视频、音频上添加人类感官可以辨识的标识来进行标记,在图像、视频中通常可以使用产品Logo、用户ID等特定标识信息。  <br> <br> 元数据:描述数据的数据,对数据及信息资源的描述性信息。  <br> <br> 人工智能生成内容标识水印:标明该多媒体内容是人工智能生成,人可感知的水印信息。  <br> <br> 人工智能生成内容标识元数据:嵌入在多媒体文件的元数据中的信息,用于标明该多媒体内容是人工智能生成。  <br> <br> 人工智能生成内容标识水印规范<br> <br> 文本<br> AI 生成<br> <br> 样式<br> <br> 水印大小<br> 4*20@1x <br> <br> *使用说明:@1x表示以375*812为基准的移动端画布,若导出更大尺寸的画布内容,请将水印按比例放大使用<br> <br> 是否可自定义修改<br> 不可以定义修改<br> <br> 使用规范 【单击以查看来源图像】<br> <br> 人工智能生成内容标识元数据规范<br> <br> 人工智能生成内容标识元数据是嵌入在多媒体文件的元数据中的信息,用于标明该多媒体内容是人工智能生成。  相关人工智能创作工具在生成多媒体内容时,可添加标识元数据到多媒体文件的元数据中;该标识元数据可被其它工具和平台识别,即不同的平台及工具能够互认标识元数据。      <br> <br> 元数据定义<br> <br> 字号<br> 属性名<br> 属性定义<br> 类型<br> 长度<br> 约束<br> 示例<br> <br> 1<br> AIGC 标检<br> <br> (AIGCLABEL)<br> 标明是AI生成内容的标记,使用aigc作为标记。<br> 字符串<br> 4字节<br> 必备<br> <br> 2<br> 版本 ( Version)<br> 元数据规范的版本·初始版本为1.0<br> 字符串<br> 3字节<br> 可选<br> Version 1.0<br> <br> 3<br> 生成工具(GeneratingTool)<br> 该AIGC内容用什么工具生成,可有生成该内容的产品名称和公司称组成。<br> 字符串<br> 32字节<br> 必备<br> Generating Tool: Douyin_Jianying<br> <br> 4<br> 时间戳 (Timestamp)<br> 生成AIGC标识的当地时间戳,时间格式为YYYY-MM-DDThh:mm:ss. 改时间戳和文件元信息中的创建时间、发布时间可能不同。<br> 字符串<br> 19字节<br> 必备<br> Timestamp: 2022-11-30T00:00:00<br> <br> 5<br> 内容实体标识 (ContentID)<br> 生成工具生成的AIGC内容的ID,包括英文字母,数字的组合。该ID具有唯一标识内容的功能,在公司内部,通常可以根据ContentID获取到内容相关的信息。<br> 字符串<br> 32字节<br> 可选<br> ContentID: v020049a0000bdfsppk81uksdg2ok310<br> <br> 6<br> 扩展信息 (ExtendInfo)<br> 可自行定义的扩展信息,例如可自定义对内容和/或元数据的签名,以增强安全性。<br> 字符串<br> <br> 可选<br> <br> 扩展原则:人工智能生成内容标识的元数据可支持扩展元素,扩展原则参照元数据规范WH/T 51-2012、WH/T 62-2014、WH/T 63-2014中的扩展原则。  <br> <br> 现有元数据规范中,如果没有恰当的元素可供复用,允许自行扩展元素。<br> <br> 自行扩展的元素不能和已有的元素有任何语义上的重复。<br> <br> 新增加的元素须优先采用其他元数据标准中的元素。<br> <br> 新增元素如果复用来自其他元数据标准的元素,必须说明来源,使用时严格遵循其语义。<br> <br> 鉴于多媒体文件格式种类繁多,为满足兼容性,本规范规定两种将标识元数据嵌入文件元数据的方式:<br> <br> 在文件元数据中新增一个扩展字段aigc,把标识元数据作为aigc字段值写入。<br> <br> 在文件元数据已有的注释comment字段值中写入标识元数据。<br> <br> 第一种方式中,标识的元数据在文件元数据中有单独字段,不会和其它字段混淆,但存在某些文件格式不支持自定义字段的可能。  元数据规范WH/T 51-2012、WH/T 62-2014、WH/T 63-2014中均含有注释comment字段,因此第二种方式具有普遍的适用性,但会和注释comment字段中可能存在的其它内容混合在一起。  在具体应用中可根据文件格式,选择适用的一种嵌入方式。  在满足兼容性的情况下,本规范推荐使用第一种方式。  <br> <br> 嵌入方式一:文件元数据中新增一个扩展字段 aigc<br> <br> 编码格式<br> JSON格式 aigc: {“GeneratingTool”: value1, “Timestamp”: value2}<br> <br> 视频示例<br> <br> ffmpeg -i input.mp4 -map_metadata -1 -c copy -movflags +use_metadata_tags -metadata aigc='{“GeneratingTool”:”Douyin_Jianying”,”Timestamp”:”2023-04-18T00:00:00″,”ContentID”:”v0300fg10000cf0kbc3c77ub10123450″}’ -f mp4 -y demo.mp4<br> <br> 图像 (xmp元数据) 示例<br> <br> img.modify_xmp({‘Xmp.dc.aigc’: ‘{“GeneratingTool”:”Douyin_Jianying”,”Timestamp”:”2023-04-18T00:00:00″,”ContentID”:”v0300fg10000cf0kbc3c77ub10123450″}’})<br> <br> 音频示例<br> <br> ffmpeg -i ./6956245659821279268.mp3 -movflags +use_metadata_tags -metadata aigc='{“GeneratingTool”:”Douyin_Jianying”,”Timestamp”:”2023-04-18T12:00:00″,”ContentID”:”v0300fg10000cf0kbc3c77ub10123456″}’ -y ./test.mp3<br> <br> 嵌入方式二:嵌入文件元数据中的注释comment字段<br> <br> 编码格式<br> JSON格式 comment: aigc:{“GeneratingTool”: value1, “Timestamp”: value2}<br> <br> 视频示例<br> <br> ffmpeg -i input.mp4 -map_metadata -1 -c copy -movflags +use_metadata_tags -metadata comment=’aigc:{“GeneratingTool”:”Douyin_Jianying”,”Timestamp”:”2023-04-18T00:00:00″,”ContentID”:”v0300fg10000cf0kbc3c77ub10123450″}’ -f mp4 -y demo.mp4<br> <br> 图像示例<br> <br> exiftool -comment=’aigc:{“GeneratingTool”:”Douyin_Jianying”,”Timestamp”:”2023-04-18T00:00:00″,”ContentID”:”v0300fg10000cf0kbc3c77ub10123450″}’ test.png<br> <br> 音频示例<br> <br> ffmpeg -i ./6956245659821279268.mp3 -metadata comment=’aigc:{“GeneratingTool”:”Douyin_Jianying”,”Timestamp”:”2023-04-18T12:00:00″,”ContentID”:”v0300fg10000cf0kbc3c77ub10123456″}’ -y ./test.mp3<br> <br> 常见问题<br> <br> 1.抖音为什么要发布人工智能生成内容标识水印及元数据规范?<br> <br> 《互联网信息服务深度合成管理规定》第16条明确要求,深度合成服务提供者对使用其服务生成或者编辑的信息内容,应当采取技术措施添加不影响用户使用的标识,17条则进一步要求,对于特定场景下,可能造成公众混淆或者误认的深度合成内容,深度合成服务提供者、服务使用者应当在生成或者编辑的信息内容的合理位置、区域进行显著标识,向公众提示信息内容的合成情况,避免公众混淆或者误认。  为了保障人工智能生成内容被有效标识,且尽可能减少因不同水印样式造成用户有不好的观感体验,抖音发布了标识水印及元数据规范。  <br> <br>  2.按照人工智能生成内容标识元数据规范写入元数据信息的图片和视频发布到抖音之后会怎么样?<br> <br> 元数据中按照人工智能生成内容标识元数据规范写入信息的内容,抖音将在必要场景告知用户此内容由AI生成,包括不限于信息流、视频详情页等添加“此内容由AI生成”的告知标签。  <br> <br> 3.如果生产的内容已经添加了AI生成的水印,我还需要按照抖音的人工智能生成内容标识水印规范来重新添加?<br> <br> 我们建议大家能够按照抖音的标识规范来添加水印,避免因工具、创作者自主添加的水印样式、水印位置不同带来不一致的观感,最大程度将创作内容以最好的样式呈现给用户。  <br> <br> 4.有哪些常用文件格式支持在元数据中新增aigc扩展字段?有哪些常用文件格式不支持?<br> <br> 支持在元数据中新增aigc扩展字段的常用文件格式有PNG/JPEG等图像格式、WMV/FLV/MP4/MOV等视频格式、MP3等音频格式,不支持的有HEIC图像格式、AVI/TS/HLS视频格式等。  <br> <br>  <br> <br> Please select text to grab.