Назад

Баланс интеллектуальной собственности и искусственного интеллекта

Вот уже как минимум 500 лет мы в рассуждаем на тему интеллектуальной собственности. В свою очередь, каждый новый виток научно-технического прогресса лишь усиливает дискуссию на эту спорную тему. Человечество разработало права на музыкальные произведения для композиторов, и даже фотография, как рукотворное искусство также может быть защищена. В прошлом веке с широким распространением музыкальных записей и VHS вопрос прав на семплирование и дистрибуцию копий кино встал еще более остро. Появление и стремительное развитие генеративного ИИ и вовсе делает ситуацию как никогда запутанной и, вероятно, требующей новых решений.

Проблемы баланса между интеллектуальной собственностью и искусственным интеллектом

Совсем скоро в широком пользовании у нас появятся простые приложения для наших гаджетов, а каждый пользователь получит возможность, к примеру, спеть любую песню голосом определенного известного исполнителя. На первый взгляд, казалось бы, крутая возможность для развлечения, не так ли? Вместе с тем обязательно возникнет и ряд очевидных вопросов. Как быть с интеллектуальной собственностью? Какую выгоду получит правовладелец? Кстати звукозаписывающие компании уже активно дискутируют на эту тему с Гугл.

Дело в том, что никто из нас не может стопроцентно воссоздать чей-либо голос, но если послушать сотню или тысячу раз какой-либо трек, то может получится что-то вроде "пастиш". В данном случае нам бы не требовалось платить отчисления автору. В том же время остается открытым вопрос, что же делать в аналогичной ситуации, но уже используя ИИ.

Важно заметить, что проблема эта актуальна не только для музыки, но и в целом для искусства. Так, запрос у Midjourney на создание изображения в стиле какого-либо известного художника может быть воспринят по-разному. Кто-то посчитает это воровством, но при посещении галерей нижнего Манхэттена или Mayfair большинство людей займут прямо противоположную позицию. Например, если вы сделаете изображение "в стиле" определенного известного художника, то любители творчества этого самого художника не упрекнут вас в плагиате.

Существует и другая проблема с использованием AI. Очевидно, что никто не будет требовать от какого-нибудь новостного ресурса вознаграждения за размещение ссылки на их новость в своем профиле Facebook. Та же газета кстати ничего не платит кафе за написание рецензии на заведение. При этом, если запросить у ChatGPT разъяснение той или иной популярной статьи для корпоративной публикации, то у новостного ресурса появляются основания для возмущения, ведь теперь получается, что компания прямо пользуется их новостями. Поэтому блокировки веб-краулера ChatGPT со стороны новостных сайтов достаточно объяснимы.

Теперь представьте, как стажер в компании прочитает ряд статей и изложит письменно их краткое содержание. И в этом случае и в вышеописанных примерах с ChatGPT в действительности не воспроизводится сам контент. Вероятно, могут быть нарушены заявленные условия предоставления услуг, тогда как резюме (не путать с выдержками) обычно не подпадает под авторское право. На самом деле никто никогда не предполагает, что определенный информационный бюллетень может нарушить авторские права сайтов-источников.

Сущность искусственного интеллекта

Сегодня ИИ создает данные для использования в колоссальных и небывалых ранее масштабах. Именно эта разница в масштабе особенно важна в текущих реалиях. Поэтому важно понять, каким должен быть закон, регулирующий вопрос взаимодействия генеративного ИИ и интеллектуальной собственности.

Однако реальная загадка не в том, вы можете указать ChatGPT на актуальные заголовки. Вопрос скорее в том, что все заголовки находятся где-то в обучающих данных, при этом отсутствуя в модели.

Неизвестно, что конкретно сегодня использует OpenAI и пользуется ли он пиратскими книгами, но, очевидно, что он частично использует "Common Crawl" . А это двузначный процент от всего интернета. Однако обучающие данные не являются моделью, в то время как LLM нельзя считать базами данных. Просматривая, массивы текстовой информации они лишь выявляют определенные закономерности в языке, не сохраняя их. К примеру, ChatGPT может проанализировать множество информации из различных изданий без сохранения. Таким образом, цель LLM - выявление закономерностей в продукте деятельности всего человеческого интеллекта, но никак не в определении содержания какого-либо рассказа.

Не стоит сравнивать OpenAI с Napster, ведь он не крадет тексты и тем более не раздает их на бесплатной основе, ведь ему вообще не нужен конкретный текст. Кроме того, OpenAI при необходимости способен переучить ChatGPT без каких-либо газетных выдержек. Вероятно, он потеряет в возможности, например, отвечать на подробные запросы о топе лучших общественных мест с привязкой к определенной местности, но такой функционал изначально не был для него целевым. В этом ключе "интеллект" скорее определяется в результате анализа косвенных показателей мышления людей.

Получается, что OpenAI использует не какой-то отдельный текстовый материал, а "все" текстовые материалы сразу. Поэтому для него некритично, если кто-то удалит, например, несколько отдельных статей.

Настоящее и будущее искусственного интеллекта

Вот тут то и встает целый ряд вопросов, о том должны ли мы менять законодательство в части добросовестного использования AI, если эта действительно основная технология на ближайшее десятилетие фактически зависит от всех нас.

Эта технология функционирует благодаря тому, что результат от введения колоссального массива открытых данных ИИ превзошел всевозможные ожидания. При этом сегодня не существует возможности повторного ввода столь же большого объема данных. Учитывая масштабы и стоимость, теперь все исследования будут направлены на совершенствование алгоритмов с использованием минимального количества данных.

Впрочем, результат на выходе не менее интересен, чем вопрос, что в себя включает модель. Можно использовать движок, собранный из музыки последнего полувека для создания чего-то абсолютно уникального и нового. Несмотря на массу вопросов, озвученных выше, есть одна очевидная вещь - это инструменты, с помощью которых можно создавать произведения искусства или просто разного рода картинки. Каждый может купить профессиональную камеру и сделать фото, но этого мало для того, чтобы называться художником. В действительности искусство фотографии состоит в том, чтобы выбрать правильный ракурс, иметь свое видение на сам процесс и результат. В то же время любой из нас может вбить запрос в Midjourney или ChatGPT без каких-либо навыков, но проблема в том, что на выходе сложно получить что-то хорошее. Пока что они лишь на начальной стадии, но со временем люди используют их для создания объектов искусства.

Столкновение интеллектуальной собственности и искусственного интеллекта

Между тем, к примеру, в Spotify сегодня присутствует множество "белых шумов", которые выпадают слушателям благодаря алгоритмам рекомендаций, получая при этом деньги за прослушивание сопоставимые со всемирно известными музыкантами. Вот тут то и встает вопрос: как мы будем отбирать реально хорошую музыку среди кучи контента, если вдруг начнется массовое производство "музыки в стиле кого-либо".

В этой связи полезно рассмотреть и показательный пример из прошлого. В Лондоне хранится копия гравюры Дюрера "Святая Анна под золотыми воротами в Иерусалиме, по Дюреру", выполненная в XVI веке руками Раймонди, ученика Рафаэля. Известно, что Дюрер был крайне недоволен такой копией и пытался судиться по этому поводу. Судебное разбирательство закончилось решением, согласно которому Раймонди было разрешено делать копии, но без эмблемы Дюрера. Вот хороший пример судебного решения по интеллектуальной собственности, демонстрирующий различные взгляды на идею подлинности. В наши дни картина, по сути, та же, поскольку одним не нравится ChatGPT, а другим вообще все равно.

Источник: “Generative AI and intellectual property”, Benedict Evans.