Искусственный интеллект и нейронные сети - инструменты кадастровой оценки недвижимости в составе Национальной системы пространственных данных
В статье исследованы нормативные правовые и научно-практические аспекты применения технологий искусственного интеллекта (ИИ) в деятельности Росреестра по определению кадастровой стоимости недвижимости. На практических примерах рассмотрены основные типы, методы и условия применения ИИ, реализуемые в Федеральной государственной информационной системе "Единая цифровая платформа "Национальная система пространственных данных". Сделан вывод о том, что для исследования ценообразующих факторов, степени и вида их влияния на кадастровую стоимость могут быть использованы специализированные типы нейронных сетей - нейронная сеть, реализующая метод главных компонент, и нейронная сеть "автоэнкодер".
Ключевые слова: Национальная система пространственных данных, анализ главных компонент сети, нейронная сеть PCA, нейронная сеть "автоэнкодер", цифровая модель территории.
The article examines the regulatory legal and scientific and practical aspects of the use of artificial intelligence (AI) technologies in the activities of the Federal Service for State Registration, cadastre and cartography in determining the cadastral value of real estate. Using practical examples, the main types, methods and conditions for the use of AI implemented in the Federal State Information System "Unified Digital Platform "National Spatial Data System" are considered. It is concluded that to study pricing factors, the degree and type of their influence on the cadastral value, specialized types of neural networks can be used - a neural network that implements the principal component method and an "autoencoder" neural network.
Key words: National spatial data system, principal network component analysis, PCA neural network, autoencoder neural network, digital territory model.
Точные и актуальные пространственные данные ("данные о пространственных объектах, включающие сведения об их форме, местоположении и свойствах, в том числе представленные с использованием координат" [1]) являются фундаментом для эффективного выполнения задач развития территорий. В Государственной программе Российской Федерации "Национальная система пространственных данных" (далее также - НСПД) определены цели создания "отечественной геоплатформы, объединяющей сведения, содержащиеся в ведомственных и региональных информационных ресурсах, реестрах и базах данных" [2], а также внедрения технологий искусственного интеллекта. Неуклонно увеличивается число публикаций, в которых рассматриваются вопросы применения искусственного интеллекта (далее также - ИИ) в задачах геовизуализации и анализа данных (например решаются задачи, связанные с дистанционным зондированием Земли, работой беспилотных летательных аппаратов) в области геодезии, картографии, кадастра (подробнее см. [3 - 6]).
Рассмотрим нормативные правовые и научно-практические аспекты применения технологий искусственного интеллекта в сфере регулирования земельно-имущественных отношений, в деятельности Федеральной службы государственной регистрации, кадастра и картографии (далее также - Росреестр), в процессах определения кадастровой стоимости недвижимости.
В июне 2019 года президиумом Совета при Президенте Российской Федерации по стратегическому развитию и национальным проектам утвержден Паспорт национального проекта "Национальная программа "Цифровая экономика Российской Федерации" [7]. В октябре того же года Указом Президента Российской Федерации от 10 октября 2019 года N 490 "О развитии искусственного интеллекта в Российской Федерации" (далее - Указ N 490) принята Национальная стратегия развития искусственного интеллекта на период до 2030 года, определяющая цели и основные задачи продвижения этой технологии в России, среди которых в том числе разработка и развитие программного обеспечения, поддержка научных исследований. Согласно указанному документу Правительству Российской Федерации было поручено разработать федеральный проект "Искусственный интеллект".
В июле 2020 года был издан Указ Президента Российской Федерации N 474 [9], в котором определены национальные цели развития Российской Федерации на период до 2030 года:
- сохранение населения;
- здоровье и благополучие людей;
- возможности для самореализации и развития талантов;
- комфортная и безопасная среда для жизни;
- достойный, эффективный труд и успешное предпринимательство;
- цифровая трансформация.
В рамках национальной цели "Цифровая трансформация" установлены следующие целевые показатели:
1) "достижение "цифровой зрелости" ключевых отраслей экономики и социальной сферы, в том числе здравоохранения и образования, а также государственного управления;
2) увеличение доли массовых социально значимых услуг, доступных в электронном виде, до 95 процентов;
3) рост доли домохозяйств, которым обеспечена возможность широкополосного доступа к информационно-телекоммуникационной сети Интернет, до 97 процентов;
4) увеличение вложений в отечественные решения в сфере информационных технологий в четыре раза по сравнению с показателем 2019 года" [9].
Цели, задачи, принципы, подходы и направления регулирования отношений в сфере технологий искусственного интеллекта и робототехники отражены в Концепции [10], принятой 19 августа 2020 года Распоряжением Правительства Российской Федерации.
Протоколом президиума Правительственной комиссии по цифровому развитию, использованию информационных технологий для улучшения качества жизни и условий ведения предпринимательской деятельности от 27 августа 2020 года N 17 утвержден Паспорт федерального проекта "Искусственный интеллект" национальной программы "Цифровая экономика Российской Федерации".
Подробный перечень технологических задач, на выполнение которых может быть направлен проект в области искусственного интеллекта, содержится в Приказе Министерства экономического развития Российской Федерации от 29 июня 2021 года N 392 "Об утверждении критериев определения принадлежности проектов к проектам в сфере искусственного интеллекта". В этом документе указанные задачи представлены в разрезе таких технологий искусственного интеллекта, как:
- компьютерное зрение;
- обработка естественного языка;
- распознавание и синтез речи;
- интеллектуальная поддержка принятия решений;
- перспективные методы искусственного интеллекта.
В октябре 2021 года вступило в силу Распоряжение Правительства Российской Федерации от 6 октября 2021 года N 2816-р "Об утверждении перечня инициатив социально-экономического развития Российской Федерации до 2030 года". В этот Перечень вошли 42 инициативы, которые сгруппированы по таким направлениям, как "социальная сфера", "строительство", "экология", "цифровая трансформация", "технологический рывок" и "государство для граждан".
В направлении "строительство" под номером 13 значится инициатива "Национальная система пространственных данных". В презентации 42 инициатив социально-экономического развития до 2030 года, размещенной на официальном сайте Правительства Российской Федерации [14], представлены запланированные ключевые результаты ее реализации (см. табл.).
Запланированные ключевые результаты реализации инициативы "Национальная система пространственных данных" [14]
До 2024 года |
До 2030 года |
Больше 200 тысяч гектаров и 2 миллионов объектов недвижимости вовлечь в экономический оборот |
Создать Единую цифровую платформу пространственных данных, запустить сервисы "Земля просто", "Земля для стройки", "Анализ состояния и использования земель" |
Более 50 процентов надзорных мероприятий проводить дистанционно - с помощью искусственного интеллекта и анализа данных |
100 процентов услуг должны быть доступными в электронном виде со сроком оказания - до 1 дня (до 1 минуты - для отдельных услуг и случаев), решения по массовым услугам должны приниматься с минимальным участием человека |
Создать сервис оценки и прогнозирования стоимости недвижимости |
Полнота данных Единого государственного реестра недвижимости (ЕГРН) должна достичь не менее 95 процентов |
Как видно из таблицы, развитие использования технологий искусственного интеллекта в России намечается и в области контрольных мероприятий по выявлению нарушений обязательных требований использования земель, а также при предоставлении государственных массовых услуг в сфере земельно-имущественных отношений.
Следует подчеркнуть, что все 42 инициативы должны быть реализованы в форме федеральных проектов, а также то, что они были включены в Единый план по достижению национальных целей развития Российской Федерации на период до 2024 года и на плановый период до 2030 года (Распоряжение Правительства Российской Федерации [15]). "Помимо новых инициатив, План связывает в единое целое национальные цели, государственные программы и проекты, определяет логику их реализации и стратегические приоритеты Правительства в этой работе, и те показатели, на которые предстоит выйти, в том числе по субъектам Российской Федерации" [16]. В указанном Плане федеральный проект "Национальная система пространственных данных" представлен в рамках национальной цели "комфортная и безопасная среда для жизни", в то время как федеральный проект "Искусственный интеллект" - в рамках национальных целей "возможности для самореализации и развития талантов", "достойный, эффективный труд и успешное предпринимательство", "цифровая трансформация".
В паспорте инициативы социально-экономического развития Российской Федерации до 2030 года "Национальная система пространственных данных" среди поставленных задач указано "применение технологий искусственного интеллекта" (см. [17]).
Постановлением Правительства Российской Федерации в декабре 2021 года была утверждена Государственная программа "Национальная система пространственных данных" [2] (ее паспорт размещен на портале государственных программ Российской Федерации), а спустя примерно полгода (в июне 2022 года) принято Положение о федеральной государственной информационной системе "Единая цифровая платформа "НСПД" (далее также - ФГИС ЕЦП НСПД) [18] <1>, в котором определены в числе прочего:
- порядок ее создания;
- входящие в ее состав подсистемы;
- типы сведений, подлежащих размещению в ней.
--------------------------------
<1> Наименование указано в редакции Постановления, введенной в действие с 1 апреля 2024 года.
Следует отметить, что в июле 2023 года в указанное Положение был внесен ряд существенных изменений, вступивших в силу с 1 января 2024 года. Так, например, список подсистем, входящих в состав ФГИС ЕЦП НСПД, был дополнен в том числе подсистемой рынка недвижимости, список сведений, подлежащих размещению в системе, - сведениями, используемыми для определения кадастровой стоимости объектов недвижимости, а список функций системы - функциями ведения фонда данных государственной кадастровой оценки (далее также - ГКО) и автоматизации ее проведения.
Целью Государственной программы "НСПД" является создание цифровой платформы, включающей сведения об объектах недвижимости, о зарегистрированных правах на недвижимое имущество, государственной кадастровой оценке, а также о пространственных данных (подробнее см. [19]). В контексте темы статьи следует подчеркнуть, что в Государственной программе [2] отмечено следующее: "в целях обеспечения дальнейшего совершенствования и развития системы государственного кадастрового учета недвижимого имущества и государственной регистрации прав на недвижимое имущество, а также инфраструктуры пространственных данных требуется реализация мероприятий, направленных на сохранение и развитие полученных результатов, в том числе с использованием возможностей Национальной системы управления данными, а также на основе технологий искусственного интеллекта".
Ответственным исполнителем Государственной программы "Национальная система пространственных данных" является Федеральная служба государственной регистрации, кадастра и картографии (далее также - Росреестр).
В конце 2021 года вступил в силу Приказ Федеральной службы государственной регистрации, кадастра и картографии N П/0642 "Об утверждении ведомственной программы цифровой трансформации Федеральной службы государственной регистрации, кадастра и картографии на 2022 финансовый год и плановый период 2023 - 2024 годов". Кроме того, "Приказами Росреестра утверждена Концепция создания ФГИС ЕЦП НСПД и создана межведомственная рабочая группа по координации мероприятий, направленных на создание ФГИС ЕЦП НСПД, и утвержден План мероприятий ("Дорожная карта") по координации создания ФГИС ЕЦП НСПД на 2022 и 2023 годы" [21].
Можно отметить, что в апреле 2024 года проходят уже достаточно активные процессы интеграции государственных информационных систем субъектов Российской Федерации с ФГИС ЕЦП НСПД. Это подтверждает результат анализа информации, представленной на официальном сайте Единой информационной системы в сфере закупок [22]. Так, в 2023 году были размещены 11 закупок, а в 2024 году - 2 закупки, объекты которых - выполнение работ, связанных с реализацией информационного взаимодействия ГИС регионов России с ФГИС ЕЦП НСПД, оказание услуг при выполнении проекта "Национальная система пространственных данных". В качестве примера объектов закупок приведем следующие:
- выполнение работ по развитию государственной информационной системы обеспечения градостроительной деятельности Ленинградской области в части интеграции с федеральной государственной информационной системой "Единая цифровая платформа "Национальная система пространственных данных" (информация от 17 января 2024 года);
- выполнение работ по развитию государственной информационной системы обеспечения градостроительной деятельности Томской области в части реализации интеграционного сервиса информационного взаимодействия с федеральной государственной информационной системой "Единая цифровая платформа "Национальная система пространственных данных" (информация от 6 декабря 2023 года);
- выполнение работ по внедрению программных интерфейсов для информационного взаимодействия информационной системы "Инфраструктура пространственных данных Приморского края" с ФГИС "Единая цифровая платформа "Национальная система пространственных данных" (информация от 12 сентября 2023 года);
- оказание услуг по модернизации государственной информационной системы "Региональная геоинформационная система Новосибирской области" в части создания интеграционного сервиса информационного взаимодействия с федеральной государственной информационной системой "Единая цифровая платформа "Национальная система пространственных данных" (информация от 30 августа 2023 года).
Обобщая изложенное, можно сделать вывод о том, что в России сформирована нормативная правовая база для развития технологий искусственного интеллекта, в том числе для их внедрения и применения в ФГИС ЕЦП "Национальная система пространственных данных".
Что же представляют собой технологии ИИ в контексте создания НСПД? Понятие "искусственный интеллект" довольно широкое и разными специалистами интерпретируется по-разному. В Указе Президента Российской Федерации [8] дано следующее определение понятия "искусственный интеллект": "это комплекс технологических решений, позволяющий имитировать когнитивные функции человека (включая самообучение и поиск решений без заранее заданного алгоритма) и получать при выполнении конкретных задач результаты, сопоставимые как минимум с результатами интеллектуальной деятельности человека".
В общем случае ИИ - это некоторая функция, строящая регрессию набора зависимых переменных от независимых. Основной чертой такой функции (или модели) является наличие этапа обучения, для различных моделей - своего. Так, например, искусственная нейронная сеть (далее также - ИНС) в зависимости от своей структуры может быть обучена несколькими десятками алгоритмов и их комбинациями. Машины опорных векторов (англ. support vector machine, SVM) являются математической моделью, получаемой без моделирования деятельности нервной клетки (нейрона, что лежит в основе ИНС), построение которой включает стадию обучения. Соответственно, они также относятся к моделям ИИ. Даже классификатор Байеса - это также ИИ, так как процесс его настройки является процессом обучения.
Таким образом, искусственный интеллект - это некоторая функция (модель), позволяющая построить регрессионную зависимость зависимых переменных от независимых и имеющая в процессе своей работы этап настройки, который можно обозначить как "обучение модели".
В англоязычной практике к определению понятия "искусственный интеллект" подходят более структурировано. Выделяют AI - artificial intelligence (искусственный интеллект) и практически равноправную с AI область ML - machine learning (машинное обучение). Это позволяет говорить об AI как о наборе моделей, а об ML - как о совокупности методов и алгоритмов их обучения. AI - это абстрактная и широкая концепция. ML - практическая область, изучающая алгоритмы обучения.
Среди моделей искусственного интеллекта можно выделить искусственные нейронные сети. Их многообразие различно - от сетей прямого распространения без обратных связей (частный случай - многослойный перцептрон) до популярных сейчас сверточных нейронных сетей огромных размеров с различными типами слоев, возможно, с обратными связями (то есть с дообучением в ходе работы) и т.п. Кроме того, имеется множество узкоспециализированных концепций - нейронная карта Кохонена, стохастическая машина Больцмана (которая лежит в основе популярного подхода к обучению, так называемого "глубокого обучения"). Также можно отметить различные алгоритмы, например:
- алгоритмы, специализированные для классификации объектов - машины опорных векторов;
- алгоритмы для поиска статистических закономерностей (классификации объектов по статистическим признакам) - k-means.
На практике цифровой сервис "Умный кадастр" "позволяет перейти от ручного точечного анализа и подворового обхода к использованию нейросетевых алгоритмов для массового выявления земельных участков и объектов капитального строительства, ошибок в сведениях ЕГРН" [23]. Кроме того, Росреестром ведется разработка сервиса "Цифровой помощник регистратора - ЕВА". "В его основе - предобученные нейронные сети, система распознавания поступивших документов и перевода их в машиночитаемый формат с последующей автоматизированной обработкой данных" [24].
Разработка и внедрение цифровых технологий, в том числе искусственного интеллекта, являются перспективными направлениями повышения экономической обоснованности кадастровой стоимости объектов недвижимости. В настоящее время "ведется разработка проекта федерального закона... согласно которому государственная кадастровая оценка будет проводиться с использованием ФГИС, обеспечивающей функционирование национальной системы пространственных данных" [25].
Использование искусственного интеллекта возможно при выполнении таких работ в рамках ГКО, как определение значений ценообразующих факторов и построение модели для метода моделирования в рамках сравнительного подхода.
Одна из основных областей применения ИИ - анализ изображений. Если выполнить тематическую обработку спутникового снимка среднего разрешения с созданием векторной карты, отражающей какой-либо ценообразующий фактор (например, наличие или отсутствие лесов и их типы - лиственный, хвойный и т.п.), то в конечном итоге можно использовать полученные векторные слои для расчета различных расстояний, площадей пересечений и т.д.
Также достаточно перспективной областью применения ИИ в рамках кадастровой оценки является использование нейронных сетей для построения оптимальных (или близких к таковым) моделей, результат может быть использован для анализа процесса моделирования, а именно:
- для определения ценообразующих факторов, которые вносят наибольший вклад в стоимость;
- для определения минимальной ошибки, возможной в идеальном случае;
- для определения вида идеальной модели (аддитивная, мультипликативная, экспоненциальная или комплексная) с использованием системы линейных уравнений.
В рамках исследования пространства ценообразующих факторов могут быть использованы специализированные типы нейронных сетей, такие как, к примеру, нейронная сеть, реализующая анализ главных компонент (также именуемый преобразованием Карунена-Лоэва - англ. principal component analysis, PCA), а также нейронная сеть "автоэнкодер". В общем случае одной из наиболее сложных задач для пользователя системы, применяющего метод моделирования, является определение набора факторов, влияющих на ценообразование.
PCA и автоэнкодер предназначены для анализа всего множества ценообразующих факторов посредством преобразования исходного пространства ценообразующих факторов в пространство меньшей размерности с контролируемой потерей информации. В итоге пользователь получает новое пространство с известным объемом сохраненной информации, оцененным в доле от исходного объема, и известным преобразованием вектора ценообразующих факторов.
Особенность автоэнкодера - возможность применения обучения без учителя с использованием алгоритмов обучения, основанных на применении метода обратного распространения ошибки. Таким образом, автоэнкодер является частным случаем многослойного перцептрона. Задача обучения автоэнкодера сводится к тому, чтобы добиться соответствия результирующего вектора входному, после чего автоэнкодер искусственно разделяют, используя в качестве "вектора-представления" "вектор-результат" функционирования одного из внутренних слоев.
Выводы
Исследовав нормативные правовые основы использования технологий искусственного интеллекта в сфере регулирования земельно-имущественных отношений и рассмотрев основные типы, методы и условия их применения, реализуемые в ФГИС ЕЦП "Национальная система пространственных данных" и системах кадастрового учета и кадастровой оценки недвижимости, авторы отмечают, что в цифровом сервисе "Умный кадастр", входящем в состав функционала ФГИС ЕЦП "Национальная система пространственных данных", реализованы нейросетевые алгоритмы для массового выявления земельных участков и объектов капитального строительства, а также ошибок в сведениях ЕГРН. На практических примерах применения систем искусственного интеллекта показывают, что в рамках исследования пространства ценообразующих факторов могут быть использованы специализированные типы нейронных сетей, такие как PCA и автоэнкодер, и предлагают использовать их для определения степени влияния ценообразующих факторов на стоимость объектов недвижимости, определения вида зависимости кадастровой стоимости (аддитивная, мультипликативная, экспоненциальная или комплексная) от ценообразующих факторов при проведении кадастровой оценки объектов недвижимости как в регионах, так и в стране.