智信禾

声音权益的AI化：全国首例侵权案件背后的法律思考

作者：智信禾

时间：2024-05-13

引言

在数字化和人工智能技术飞速发展的今天，声音作为一种独特的个人标识，其法律保护问题日益凸显。近期，北京互联网法院审理的全国首例AI生成声音人格权侵权案，为我们提供了深入探讨这一问题的机会。

案情简介：

原告殷某是一名配音师，经朋友告知，殷某发现他人利用其配音制作的作品在多个知名App广泛流传。经声音筛选和溯源，上述作品中的声音来自被告一北京某智能科技公司运营的平台中的文本转语音产品，用户通过输入文本、调整参数，可实现文本转化成语音的功能。原告殷某将涉事的几家公司告上法庭，主张其声音权益被侵犯，要求停止侵权、赔礼道歉及赔偿经济损失、精神损失。[1]

法院观点：

北京互联网法院审理认为，利用人工智能合成的声音，如果能使一般社会公众或者相关领域的公众根据其音色、语调和发音风格，关联到该自然人，可以认定为具有可识别性。本案中，使用原告个人声音开发涉案文本转语音产品与原告的音色、语调、发音风格等具有高度一致性，能够使一般人产生与原告有关的思想或感情活动，能够将该声音联系到原告本人，进而识别出原告的主体身份。因此，原告声音权益及于涉案AI声音。

法院同时指出，本案中，被告对录音制品享有著作权等权利，但不包括授权他人对原告声音进行AI化使用的权利。在未经原告本人知情同意的情况下，AI化使用原告声音的行为无合法权利来源，且构成对原告声音权益的侵犯，应承担相应的法律责任。

案件评析：

在新媒体时代，互联网、大数据和人工智能的发展，使得声音的记载、利用与传播的方式大为增加，借由声音识别技术的发展，声音与人格的关联也变得前所未有的紧密。而我国《民法典》第1023条首次提出自然人的声音通过参照适用肖像权相关规定进行保护，可见，我国将声音视为一项人格权益，明确了声音的人格权属性。

而《民法典》第1018条第2款规定肖像是在一定载体上所反映的特定自然人可以被识别的外部形象。据此可知，声音的可识别性是声音权益具有人格属性、可作为一项人格利益保护的前提条件。

常言道“未见其人先闻其声”，人们听到一种声音之后判断该声音归属于某一特定主体。自然人的声音与其人格是直接联系在一起的，与个人在社会生活中的主体地位也具有直接关联度，这也使得声音可以成为身份识别的重要依据[2]。本案中，原告殷某作为配音师，因职业特性而使其声音具有较高的商业价值和社会认可度，被告未经同意将其声音AI化并用于商业目的，已然侵犯殷某的声音权益。

同时，法院明确了AI生成声音在具备可识别性的前提下，自然人声音权益的保护范围可以及于AI生成声音，因而对录音制品的授权并不意味着对声音AI化的授权，未经权利人许可，擅自使用或许可他人使用录音制品中的声音构成侵权。总而言之，在享受人工智能技术带来的便利之余，也要警惕随之而来的法律风险，声音权益作为具有财产价值的人格利益，不仅承载精神利益，而且包含一定的经济价值，能够成为商业化利用的对象，这无疑需要构建健全的声音权益保护机制，保护每个人的“无形财产”。

[1] “全国首例AI生成声音人格权侵权案一审宣判”，载“北京互联网法院”公众号，2024.04.23

[2] 《论声音权益的法律保护模式》，载《财经法学》，2024年第1期