Как устроен ИИ: большие языковые модели и архитектура RAG

Юрист задаёт системе вопрос: может ли государственное учреждение учредить общество с ограниченной ответственностью. Обычная языковая модель отвечает по статистической памяти. Специализированная RAG-система сначала ищет релевантные нормы, судебную практику и разъяснения, затем формирует ответ с цитатами и ссылками. Разница между этими подходами определяет качество юридического результата. После урока вы сможете объяснить, что происходит между запросом и ответом, зачем RAG нужен юристу, чем семантический поиск отличается от поиска по ключевым словам и почему LLM нельзя приравнивать к справочно-правовой системе.

Что происходит, когда юрист нажимает «отправить»: от запроса до ответа

Большая языковая модель, или LLM (Large Language Model), — это нейронная сеть, обученная на крупных текстовых массивах для генерации связного текста. Она получает на вход текстовый запрос, разбивает его на токены и строит ответ как последовательность вероятных продолжений.

Токен — минимальная единица текста, с которой работает модель. В учебном контексте один токен можно приблизительно считать частью слова или словом в зависимости от языка и модели. Модель не видит юридический вопрос так, как его видит юрист. Она видит последовательность токенов и рассчитывает вероятное продолжение этой последовательности.

Обычная LLM работает по принципу генерации текста на основе обучающей выборки. Обучающая выборка — массив текстов, на которых модель обучалась. Этот массив определяет, какие формулировки, связи и паттерны модель умеет воспроизводить. Для юриста это имеет прямое значение. Если модель не обучалась на актуальном массиве российского законодательства, судебной практики и юридических разъяснений, она не может выступать полноценным источником актуального права.

RLHF (Reinforcement Learning from Human Feedback) — метод дообучения модели с использованием оценок людей. Люди сравнивают ответы, выбирают более полезные, подробные и понятные варианты, а модель учится чаще генерировать ответы такого типа. Этот механизм делает ответы удобнее для пользователя. Он не превращает модель в правовую базу данных.

В юридической работе базовая LLM полезна там, где юристу нужен текстовый помощник. Она может сделать саммари, разбить текст на части, выделить ключевые мысли, переписать сложную формулировку простым языком, подготовить черновик письма, помочь со структурой документа. Эти задачи относятся к обработке текста, а не к самостоятельному установлению действующего права.

Роман Янковский описывает роль специализированного юридического ИИ через ограничение, которое юрист должен держать в голове:

«Наша нейросеть, она не заменяет профессионального юриста, но она помогает ему эффективнее готовиться к судебным заседаниям, эффективнее анализировать документы, эффективнее искать источники регулирования.» — Роман Янковский, к.ю.н., менеджер по развитию сервиса Нейроюрист, Яндекс

Практический вывод простой. LLM полезна как ускоритель рутины. Юрист остаётся субъектом профессионального суждения, проверки источников и принятия решения.

RAG: когда модель отвечает по источникам, а не «по памяти»

RAG (Retrieval-Augmented Generation) — генерация, дополненная поиском. В такой архитектуре система не передаёт вопрос пользователя модели сразу. Сначала она ищет релевантные материалы во внешней базе, затем добавляет найденные фрагменты к запросу, после чего модель формирует ответ с опорой на эти источники.

В юридическом сервисе этот процесс можно разложить на четыре шага.

Шаг	Что делает система	Юридический смысл
Классификация вопроса	Определяет отрасль или сферу права	Отрасль влияет на метод регулирования и систему источников
Поиск источников	Ищет нормы, судебные акты, разъяснения, документы пользователя	Модель получает материалы для ответа
Обогащение запроса	Добавляет найденные фрагменты к вопросу пользователя	Ответ строится не только на обучающей выборке
Генерация ответа	Формирует вывод, цитаты и ссылки	Юрист видит источник и может его проверить

Роман Янковский сравнивает RAG с экзаменом open book. Студент отвечает не только по памяти, а с доступом к источникам. Для юриста это точная аналогия. Обычная LLM похожа на студента без материалов. RAG-система даёт модели нормы, судебную практику, документы пользователя и иные релевантные фрагменты до того, как модель начнёт отвечать.

Специализированный юридический RAG учитывает отраслевую структуру права. В процессуальном праве нельзя смешивать гражданский процесс и арбитражный процесс только потому, что формулировки похожи. В гражданском праве, напротив, общие положения Гражданского кодекса могут дополняться специальными законами. Такая настройка требует юридической экспертизы, а не только технического поиска.

RAG полезен для вопросов, где юристу нужны источники. Система может найти применимые нормы, собрать разрозненные положения по одной теме, указать судебную практику, показать цитаты и дать ссылки. Такой ответ удобнее, чем текст без проверяемой опоры.

Сильная RAG-система должна уметь отказаться от ответа, если источник не найден. Для юридической работы это достоинство, а не слабость. Есть вопросы, которые прямо не урегулированы. В таком случае корректный ответ должен отделять общие нормы от отсутствия специального регулирования.

Семантический поиск и проекты: как ИИ ищет по смыслу

Классический поиск по правовой базе часто работает через ключевые слова. Юрист вводит формулировку, система находит документы, где встречается эта формулировка. Этот подход полезен, когда юрист знает точный термин, номер статьи, устойчивое выражение или фрагмент нормы.

Семантический поиск работает иначе. Он ищет не только совпадение слов, а смысловую близость ситуации. Юрист может описать фактическую ситуацию своими словами, а система найдёт похожие ситуации в судебных решениях или документах. Для поиска судебной практики это меняет стратегию работы.

Пример из контекста: юристу не нужны 100–500 решений, где цитируется одна статья. Ему нужны дела с обстоятельствами, похожими на его спор. Семантический поиск помогает найти такие решения даже при различии слов в запросе и в судебном акте.

Критерий	Поиск по ключевым словам	Семантический поиск
Основа поиска	Совпадение слов и формулировок	Смысловая близость запроса и документа
Когда полезен	Известна точная норма, термин или цитата	Известна фактическая ситуация
Риск	Пропустить релевантный документ с иной формулировкой	Получить похожий, но не тождественный кейс
Роль юриста	Проверить найденные документы	Оценить юридическую сопоставимость ситуаций

В специализированных системах RAG может работать не только с общей правовой базой. Юрист может загрузить собственные документы и создать проект. Проект — папка с источниками, по которым система будет искать и отвечать. В контексте Нейроюриста описан сценарий загрузки до 1000 источников.

Такой проект можно использовать как малую внутреннюю базу знаний. В неё загружают локальные нормативные акты, подборку судебных решений, документы по узкой отрасли, материалы конкретного проекта или исторические источники. Система отвечает по тем документам, которые пользователь добавил в проект.

Этот подход полезен для юридических департаментов. Один сотрудник может загрузить локальные акты компании и поделиться проектом с коллегами. После этого юристы получают единый источник для поиска и анализа внутренних материалов. Система не просто ищет документ. Она формирует ответ по выбранным источникам.

Контекстное окно: технический предел и рабочая точность

Контекстное окно — объём текста, который модель может обработать в одном диалоге или запросе. В контекст могут входить вопрос пользователя, история переписки, загруженные документы, найденные источники и системные инструкции.

Технический предел контекстного окна показывает максимальный объём, который модель способна принять. Эффективный предел показывает объём, с которым модель сохраняет приемлемое качество работы. Для юриста важен второй показатель. Большое контекстное окно не означает, что модель одинаково внимательно обработает весь массив.

В учебном контексте приводится практическая оценка: качество может заметно снижаться уже на 10–20 тысячах токенов. Это не означает, что модель перестаёт работать. Это означает, что растёт риск потери деталей, слабого внимания к середине документа и неверной сборки выводов.

Для юридических задач это критично. Договор на 60 страниц, правила платёжной системы, подборка судебных актов или многотомное дело содержат много взаимосвязанных элементов. Если загрузить всё сразу и попросить «проанализировать», модель может упустить важное условие, неправильно связать сроки, смешать источники или дать поверхностный вывод.

RAG снижает этот риск за счёт предварительного поиска релевантных фрагментов. Система не обязана передавать модели весь массив. Она может найти нужные куски текста и включить в контекст только их. Качество ответа зависит от того, насколько правильно система классифицировала вопрос, нашла источники и собрала контекст.

В юридическом интерфейсе это выражается через настройки. Пользователь может выбрать сферу права, включить или выключить интернет-поиск, прикрепить документы, исключить судебную практику, ограничить источники, создать новый чат или продолжить прежний диалог. Каждый параметр влияет на то, какие данные попадут в контекст.

Интернет-поиск в юридической системе по умолчанию может быть выключен. Причина указана в контексте: в интернете встречаются устаревшие редакции нормативных актов. Справочно-правовая база даёт актуальные редакции, если сервис получает данные от такого поставщика. Поэтому источник контекста важнее размера контекста.

Доступные модели и прикладная оценка качества

Выбор модели влияет на качество юридической работы. В методическом пособии O2 Consulting указано, что более современная модель может требовать более простой стартовой инструкции. Более старые или простые модели чаще нуждаются в подробной инструкции и пошаговой постановке задачи.

В пособии приводится пример работы с Gemini 2.0 Pro Experimental в Google AI Studio. Материал указывает, что выбор модели пользователь определяет самостоятельно. Для практики важнее не название модели само по себе, а способность модели решать конкретный класс юридических задач.

Оценивать LLM в юридической работе можно по нескольким компонентам.

Компонент	Что проверяет юрист
Качество генерации текста	Насколько результат читаемый, полный и пригодный для редакторской доработки
Понимание контекста и инструкций	Учитывает ли модель вводные, ограничения и формат задачи
Юридическая точность	Не допускает ли модель грубые ошибки в праве и толковании
Практическая полезность	Экономит ли результат время юриста в конкретной задаче

Для юридических задач юридическая точность не может быть факультативным критерием. Хороший стиль без точного источника не имеет самостоятельной ценности. Черновик договора, таблица рисков или ответ на вопрос должны проходить проверку человеком.

Контекст содержит перечень задач, где LLM может быть полезна юристу: интерпретация и упрощение юридических текстов, составление проектов писем, претензий, договоров и исков, анализ договоров и переписки, редактирование документов, поиск и анализ судебной практики, визуализация юридической информации, создание внутренних документов, описание бизнес-процессов, подготовка к выступлениям, обучение и контент-маркетинг.

Эти задачи различаются по сложности. Саммаризация, рерайтинг и структурирование текста обычно ближе к текстовой обработке. Поиск судебной практики, прогнозирование спора и толкование сложной нормы требуют более строгой проверки, RAG-архитектуры и участия юриста.

LLM и правовая база данных: принципиальная разница

LLM и справочно-правовая система решают разные задачи. Правовая база данных хранит нормативные акты, судебные решения, разъяснения и иные источники. Она организует поиск по массиву документов. LLM генерирует текст на основе входного контекста и обученных языковых закономерностей.

Обычную LLM нельзя использовать как авторитетный источник актуального законодательства. Модель обучена на данных до определённой даты. Она не обязана знать последующие изменения нормативных актов. Она может не иметь прямого доступа к российским правовым базам. Она может дать убедительный текст без проверяемого источника.

Юридическая RAG-система занимает промежуточное положение. Она использует LLM как генератор ответа, а правовые базы — как источник данных. Если система получает актуальные редакции нормативных актов от справочно-правовой системы, она может формировать ответы с опорой на актуальный массив. В контексте Нейроюриста указано сотрудничество с Гарантом как поставщиком актуальных данных.

Правовая база даёт документ. RAG-система помогает собрать ответ по документам. Юрист проверяет вывод, потому что даже правильный источник не гарантирует правильное применение к фактам. Специализированный сервис может ускорить поиск, анализ договора, сравнение документов, проверку рекламы, подготовку таймлайна и оценку рисков. Финальное юридическое решение остаётся за человеком.

Роман Янковский формулирует этот принцип прямо:

«Человек всегда должен участвовать в принятии юридических решений.» — Роман Янковский, к.ю.н., менеджер по развитию сервиса Нейроюрист, Яндекс

Для юридической практики лучшая модель использования выглядит так: правовая база обеспечивает источник, RAG находит и собирает релевантные фрагменты, LLM формирует понятный ответ, юрист проверяет и принимает решение.

Запомнить

LLM генерирует текст, а не хранит актуальное законодательство как правовая база.
RAG добавляет к запросу найденные источники и снижает зависимость от «памяти» модели.
Семантический поиск ищет похожие ситуации по смыслу, а не только по словам.
Контекстное окно имеет технический и эффективный предел; большой объём не гарантирует точность.