Модели доступа к данным для обучения систем, поддерживающих диалог на естественном языке (AI-чат-ботов на основе LLM), как ключевой элемент развития искусственного интеллекта в России и за рубежом: правовые аспекты

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Технологии, системы и алгоритмы искусственного интеллекта (ИИ) в России, как и за рубежом, стремительно развиваются. В этом формате все большее значение и актуальность приобретает вопрос о данных для обучения систем, поддерживающих диалог на естественном языке (AI-чат-ботов на основе LLM) с позиции моделей доступа к ним и в сравнении подходами стран (США, КНР) и их союзов (Европейский союз) параллельно с Россией развивающих искусственный интеллект в направлении получения «сильного» ИИ. Такое исследование также помогает лучше увидеть место России в рейтингах, оценивающих степень развития отношений по поводу искусственного интеллекта. При рассмотрении этого вопроса автор исходит из объективно-субъективной заданности мира, предполагая возникновение ИИ частью объективной реальности и объективного процесса развития человечества и, опираясь на диалектику. Научная новизна, теоретическая и практическая значимость обусловлена целью исследования, кругом исследованных источников и проблем. В числе выводов, к которым пришла автора, например, следующие: в условиях, когда данные становятся (если уже не стали) новой нефтью, необходимо 1) преодолеть узкое место новой экономической системы – экономики данных – наступление «цифрового феодализма» - ситуации, при которой основные ресурсы и доступ к ним контролируются ограниченным числом цифровых платформ (частных или государственных) , которые не дают доступ для бизнеса, 2) распространить региональные инициативы (напр., ЭПР г. Москвы или озера данных промышленных предприятий РТ РФ либо ЭПР г. Шанхая) на другие субъекты и/или регионы, ибо региональные «озера» бесполезны без федеральной интеграции, 3) разрешить бизнесу бесплатный доступ к обезличенным данным ЖКХ, транспорта, госзакупок и др., создав также механизм монетизации данных для бизнеса (напр., создать национальный маркетплейса данных по аналогии с Microsoft (Azure), где бизнес обменивается данными за налоговые льготы.

Об авторах

Ксения Михайловна Беликова

ФГАОУ ВО «Московский государственный юридический университет имени О.Е. Кутафина (МГЮА)»

Автор, ответственный за переписку.
Email: KMBelikova@msal.ru
ORCID iD: 0000-0001-8068-1616
SPIN-код: 2541-3498

доктор юрид. наук, профессор, профессор кафедры предпринимательского и корпоративного права

Россия, г. Москва

Список литературы

  1. Беликова К.М. Экспериментальное правовое регулирование в сфере искусственного интеллекта в России (на примере г. Москвы). // Пробелы в российском законодательстве. Юридический журнал. 2024. Т. 17. № 5. С. 045–052. doi: 10.33693/2072-3164-2024-17-5-045-052. EDN: NHVEGK.
  2. Беликова К.М. Экспериментальное правовое регулирование искусственного интеллекта за рубежом. // Право и бизнес. 2024. № 4. С. 2–6. doi: 10.18572/2712-8865-2024-4-2-6.
  3. Беликова К.М. Глобальное сражение за искусственный интеллект: нормативные и иные акты, регулирующие отношения в сфере разработки и применения искусственного интеллекта в США // Лоббирование в законодательстве. 2025. Т. 4. № 3. С. 24–34. doi: 10.33693/2782-7372-2025-4-3-24-34. EDN: ZKZKJX.
  4. Беликова К.М. О роли, значении и достоверности рейтингов в сфере отношений по поводу искусственного интеллекта // Лоббирование в законодательстве. 2025. Т. 4. № 3. С. 80–94. doi: 10.33693/2782-7372-2025-4-3-80-94. EDN: ZNVIAK.
  5. Правовое регулирование новых военных технологий в свете законодательства об интеллектуальной собственности и ответственность ученого в странах БРИКС: монография. / К.М. Беликова и др.; отв. ред. Беликова К.М. М.: Типография ООО “МДМпринт” (Печатный салон МДМ), 2022. С. 267–268 (528 с.; ил.)
  6. Саяпин С.П. О правовом регулировании генеративного искусственного интеллекта в Китае // Право и политика. 2025. № 3. С. 19–29. doi: 10.7256/2454-0706.2025.3.73708 EDN: KXCIPE. URL: https://nbpublish.com/library_read_article.php?id=73708 (дата обращения: 05.08.2025)
  7. Климович А.П. Влияние цифровых технологий на современное общество. Пример системы рейтинга социального кредита в Китае // Цифровая социология. 2020. Т. 3. № 3. С. 35–44. doi: 10.26425/2658-347X-2020-3-Т3-35-44.
  8. Варуфакис Я. Технофеодализм. Что убило капитализм / Я. Варуфакис «Ад Маргинем Пресс», 2023. 151 с.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Иллюстративный пример озера данных

Скачать (166KB)
3. Рис. 2. Иллюстративный пример хаба данных

Скачать (19KB)
4. Рис. 3. Схема использования Azure Open Datasets

Скачать (75KB)
5. Рис. 4. Внедрение ИИ в промышленность стран ЕС (на 2020 г.)

Скачать (93KB)
6. Рис. 5. Готовность к распространению ИИ в странах ЕС, США, Великобритании (2019 г.)

Скачать (302KB)
7. Рис. 6. Динамика подачи заявок и выдачи патентов на искусственный интеллект в США, Европе и Китае (на 2022 г.)

Скачать (132KB)
8. Рис. 7. Присутствие американских ВМС, ВВС, войск и др. в АТР

Скачать (86KB)

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».