Юрист получает договор с заполненными данными клиента. В документе есть ФИО, адреса, реквизиты, цена сделки, порядок исполнения и коммерчески чувствительные условия. Возникает рабочий соблазн: загрузить файл в ChatGPT, Gemini или иной ИИ-сервис и попросить найти риски. Именно в этот момент юридическая задача превращается в задачу по ФЗ-152, конфиденциальности и трансграничной передаче данных. После урока вы сможете определить, какие данные нельзя отправлять в публичные ИИ-сервисы, когда возникает риск нарушения закона, как выстроить безопасный контур работы и зачем юристу нужен собственный анонимайзер.
Персональные данные: что юрист передаёт в ИИ на самом деле
Федеральный закон №152-ФЗ «О персональных данных» регулирует обработку информации, которая позволяет идентифицировать конкретного человека. ⚠️ Проверить актуальность редакции
Персональные данные — это любая информация, которая прямо или косвенно относится к определённому или определяемому физическому лицу. В юридической работе это не только ФИО, паспортные данные и адрес регистрации. Электронная почта, номер телефона, IP-адрес, cookie-идентификатор, данные аккаунта, сведения из формы обратной связи и совокупность косвенных признаков тоже могут образовать персональные данные.
Для юриста риск возникает не из-за самого факта использования ИИ. Риск возникает из-за состава данных, которые юрист передаёт в сервис. Если в договоре, претензии, судебной позиции или клиентской переписке есть сведения, позволяющие установить личность субъекта, юрист фактически передаёт персональные данные третьему лицу.
Типичный сценарий выглядит просто. Юрист готовит договор и хочет проверить риски. Документ уже содержит данные клиента или доверителя. Юрист загружает файл в публичную нейросеть. Сервис обрабатывает текст на своих серверах. Если серверы находятся за пределами Российской Федерации, возникает дополнительный блок вопросов: локализация, основание обработки, договор с обработчиком, трансграничная передача и ответственность оператора.
Оператор персональных данных — лицо, которое организует или осуществляет обработку персональных данных. В корпоративной практике оператором часто выступает компания, получившая данные клиента, работника или контрагента. Если сотрудник компании отправляет клиентский документ в ИИ-сервис, он действует внутри контура оператора. Ошибка сотрудника может создать риск для всей организации.
Ответственность за нарушения в сфере персональных данных усилилась после изменений законодательства с 2023 года. В отдельных случаях ответственность может достигать 500 миллионов рублей. Такой размер относится к повторной утечке большого массива персональных данных. Для повседневной юридической работы ключевой вывод проще: даже один документ с персональными данными требует проверки перед загрузкой в ИИ.
Три столпа ФЗ-152: локализация, согласие и трансграничная передача
При работе с ИИ-сервисами юрист должен проверить три блока: где хранятся данные, есть ли право на обработку и происходит ли передача за пределы Российской Федерации.
| Блок | Что проверяет юрист | Практический вопрос |
|---|---|---|
| Локализация | Где находятся первичные базы данных российских граждан | Собраны ли данные через российский контур и где они хранятся |
| Согласие на обработку | Есть ли законное основание для обработки | Понимает ли субъект, кто, зачем и как обрабатывает его данные |
| Трансграничная передача | Передаются ли данные на территорию иностранного государства | Можно ли отправлять документ в сервис с серверами за рубежом |
Локализация означает, что первичные базы персональных данных российских граждан должны находиться на территории Российской Федерации при сборе таких данных. Если компания собирает персональные данные с использованием иностранных сервисов, она может нарушить требование локализации. Если компания собрала данные через российский сервис и затем передаёт их дальше, риск зависит от конкретного сценария передачи.
Согласие на обработку должно быть добровольным, конкретным, информированным и однозначным. Субъект должен понимать, кто собирает данные, для какой цели, какие действия с ними совершает и кому передаёт. Субъект также должен иметь возможность прекратить обработку.
Для ИИ-сервисов это создаёт практическую проблему. Пользователь часто не знает, где именно сервис хранит данные, кто имеет доступ к логам, используются ли запросы для дообучения, какие субподрядчики участвуют в обработке и в какой юрисдикции находятся серверы.
Трансграничная передача персональных данных возникает при передаче данных на территорию иностранного государства. При загрузке документа с персональными данными в иностранный ИИ-сервис юрист может совершить такую передачу. США в контексте урока указаны как юрисдикция, передача в которую не является приемлемой для персональных данных российских субъектов.
Отдельный риск связан с договором на обработку персональных данных. Если оператор передаёт данные обработчику, договор должен соответствовать требованиям законодательства. В лекции указано, что таких требований девять. За нарушения обработчика может отвечать оператор. Это означает, что утечка у провайдера ИИ-сервиса не всегда снимает ответственность с компании, которая отправила данные.
Что происходит с данными после нажатия «Отправить»
Публичная нейросеть не является личным блокнотом юриста. После отправки текста, файла или фрагмента договора пользователь передаёт сведения внешнему сервису. Сервис может хранить запросы, обрабатывать их на удалённых серверах, использовать инфраструктуру третьих лиц и фиксировать данные аккаунта пользователя.
Юрист не контролирует полный технический контур публичного ИИ-сервиса. Он не может гарантировать, что данные не попадут к третьим лицам. Он не может полностью управлять тем, где именно сервис обрабатывает запрос. Он не может ссылаться на внутренний режим адвокатской тайны или коммерческой тайны перед публичным провайдером так же, как внутри своей организации.
В контексте урока публичные нейросети рассматриваются как зона повышенного риска для конфиденциальной информации. Причина проста: провайдер может столкнуться со взломом, ошибкой доступа, утечкой логов или раскрытием переписок. Пользователь должен исходить из того, что всё загруженное в публичный сервис потенциально может стать доступным третьим лицам.
Юрист должен отдельно оценивать не только персональные данные. В юридических документах часто есть сведения, которые не выглядят как персональные данные, но имеют коммерческую ценность. К таким сведениям относятся цена сделки, порядок исполнения, предмет сделки, сведения о продаже компании, условия переговоров, структура финансирования, позиция по спору, стратегия защиты и слабые места аргументации.
Для M&A-сделок риск особенно высок. Слухи о продаже компании могут повлиять на стоимость активов или акций. В судебной работе раскрытие позиции может усилить процессуального оппонента. В адвокатской практике загрузка материалов дела может привести к размыванию адвокатской тайны.
Безопасный подход начинается с принципа минимизации данных. Юрист передаёт в ИИ только те сведения, которые нужны для конкретной задачи. Если задача состоит в проверке структуры договора, сервису не нужны ФИО сторон, адреса, банковские реквизиты и реальные суммы. Если задача состоит в редактировании формулировки, сервису не нужен полный комплект приложений и переписки.
Что нельзя загружать в публичные нейросети
Публичные ИИ-сервисы нельзя использовать как хранилище клиентских материалов. В контексте урока выделены категории данных, которые нельзя загружать без предварительной очистки и правовой проверки.
| Категория данных | Почему нельзя загружать |
|---|---|
| Адвокатская тайна | Раскрытие может лишить сведения специального режима защиты |
| Персональные данные третьих лиц | Возникают риски нарушения ФЗ-152 |
| Коммерческая тайна | Раскрытие может повлечь имущественный ущерб |
| Конфиденциальные условия сделки | Предмет, цена и порядок исполнения могут иметь самостоятельную ценность |
| Судебные материалы | В них есть стратегия, доказательства, сведения о клиентах и процессуальная позиция |
| Клиентская переписка | В ней часто есть идентификаторы, признания, инструкции и фактическая позиция |
| Любые сведения, раскрытие которых нежелательно | Публичный ИИ-сервис не должен получать данные, которые нельзя показать третьему лицу |
В лекции приведены два показательных сюжета.
Первый сюжет связан с DeepSeek в январе 2025 года. После появления сервиса была описана ситуация, при которой посторонние лица получили доступ к перепискам пользователей и данным аккаунтов. Практический вывод для юриста состоит не в оценке конкретного провайдера. Вывод в том, что публичный ИИ-сервис может стать источником раскрытия данных.
Второй сюжет связан с американским адвокатом. Адвокат использовал ChatGPT для улучшения правовой позиции и раскрыл существенные сведения, полученные от подзащитного. Правоохранительные органы получили доступ к перепискам, сопоставили данные и усилили позицию обвинения. На довод о нарушении адвокатской тайны последовал ответ, что такой обмен информацией не покрывается иммунитетом адвокатской деятельности.
Для российской практики из этого следует рабочее правило. Если юрист не готов раскрыть документ третьему лицу, он не должен загружать его в публичную нейросеть без очистки. Это правило распространяется на иностранные и российские публичные сервисы.
Обезличивание: от ручного удаления к синтетическим данным
Обезличивание — процедура, при которой из данных удаляют или изменяют признаки, позволяющие установить субъекта. В юридической работе обезличивание должно охватывать не только ФИО и адреса. Юрист должен проверить все элементы, которые могут восстановить связь между документом, сделкой, клиентом и фактической ситуацией.
Простое удаление имён не всегда достаточно. Если в документе остаются уникальные детали сделки, предмет, цена, редкая комбинация условий, город, дата, должность и отрасль, субъект или компания могут быть идентифицированы косвенно. Поэтому корректное обезличивание требует юридической оценки содержания.
Базовый уровень — ручная очистка. Юрист перед загрузкой удаляет имена сторон, адреса, реквизиты, телефоны, электронные адреса, номера договоров, номера дел, паспортные данные, ИНН, банковские данные, сведения о представителях и иные идентификаторы. Этот способ занимает время и может снизить точность ответа модели, но он уменьшает риск раскрытия.
Следующий уровень — замена на переменные. Вместо реального клиента используется «Сторона 1». Вместо объекта используется «Объект А». Вместо суммы используется «Сумма X». Такой подход сохраняет структуру юридической задачи и убирает прямые идентификаторы.
Более продвинутый уровень — синтетические данные. В лекции приведён пример: «ромашки» заменяются на «айсберг». Смысл подхода состоит в том, чтобы разорвать связь между реальной сделкой и её описанием. Юрист сохраняет логику анализа, но заменяет фактические маркеры на искусственные аналоги.
При работе с большими массивами документов ручной метод становится трудоёмким. Тогда возникает задача создать профессиональное решение, которое ищет персональные данные, коммерчески значимые сведения и иные чувствительные элементы. Такой инструмент может удалять или заменять данные до передачи документа в ИИ-сервис.
Кастомный анонимайзер и правомерные сценарии работы
Кастомный анонимайзер — внутренняя программа, которая очищает документы под конкретную юридическую практику. Такой инструмент полезен юридической фирме, адвокатскому образованию или корпоративному юридическому департаменту. Универсальная очистка часто пропускает отраслевые детали. Внутренний анонимайзер можно настроить под типовые договоры, судебные материалы, претензии, кадровые документы и клиентские переписки.
В контексте урока указано, что современный ИИ-агент может помочь создать такую программу при корректной постановке задачи. Пользователь описывает свою работу, типы документов и виды данных, которые обычно встречаются в практике. Агент формирует программу, которая удаляет или заменяет чувствительные сведения.
Ты — помощник по созданию внутреннего анонимайзера юридических документов. Опиши, как разработать программу, которая будет находить и заменять персональные данные, реквизиты, адреса, суммы, номера договоров, номера судебных дел, сведения о сторонах, коммерчески значимые условия и иные конфиденциальные фрагменты. Учитывай, что документы относятся к юридической практике и могут включать договоры, судебные материалы, претензии, клиентскую переписку и сделочные документы. Предложи структуру правил замены на синтетические данные и переменные вида «Сторона 1», «Объект А», «Сумма X».
Статус: ⚠️ Адаптировать под свой контекст
Модель: Claude Code / иной агент для разработки, если используется в рабочем контуре
Формулировка работает лучше, потому что задаёт тип документов и классы защищаемых данных. Модель получает не абстрактную просьбу «сделай анонимайзер», а юридически релевантную карту сущностей.
После очистки документов юрист может использовать ИИ в более безопасных сценариях. К таким сценариям относятся саммаризация, разбиение текста на части, выделение ключевых мыслей, редрафтинг, рерайтинг, структурирование базы знаний и работа с обезличенными фрагментами. Такие задачи не требуют передачи полного клиентского досье.
Отдельный безопасный сценарий — создание личной или корпоративной базы знаний. Юрист может структурировать собственные материалы, проекты, шаблоны и выводы. Если база содержит клиентские сведения, перед загрузкой в ИИ-контур её нужно очистить. Для корпоративного использования лучше применять решения, где данные не используются для дообучения модели, либо локальные on-premise-системы.
On-premise — локальное размещение системы на инфраструктуре организации. Такой подход снижает риск передачи данных внешнему провайдеру. Он не отменяет обязанности соблюдать ФЗ-152, режим коммерческой тайны и внутренние политики безопасности.
Запомнить
- Публичная нейросеть — внешний сервис, а не личное рабочее пространство юриста.
- Перед загрузкой документа юрист проверяет персональные данные, адвокатскую тайну и коммерческую тайну.
- Безопасная работа начинается с минимизации данных и обезличивания.
- Для регулярной практики нужен кастомный анонимайзер или локальный ИИ-контур.