Роскомнадзор планирует усилить систему фильтрации интернет-трафика, добавив в нее инструменты машинного обучения. С их помощью ведомство рассчитывает быстрее находить запрещенные сайты, их «зеркала» и сервисы для обхода блокировок. На внедрение таких технологий планируется направить 2,27 миллиарда рублей. Об этом сообщает Forbes со ссылкой на план цифровизации Роскомнадзора.
Документ уже направлен в профильную правительственную комиссию. Согласно нему, новые инструменты будут работать на базе уже действующих технических средств противодействия угрозам (ТСПУ), установленных на сетях операторов связи в рамках закона о «суверенном интернете». Эти системы позволяют анализировать проходящий через сети операторов интернет-трафик и блокировать доступ к сайтам, которые власти считают запрещенными. Роскомнадзор самостоятельно устанавливает и обслуживает ТСПУ у операторов связи.
По данным ведомства, с помощью этих средств в России уже заблокировано более миллиона интернет-ресурсов. В среднем ежедневно ограничения вводятся в отношении нескольких тысяч новых доменов и сетевых адресов.
Эксперты считают, что использование искусственного интеллекта может сделать блокировки более гибкими и масштабными. Алгоритмы способны выявлять копии сайтов, которые создаются под новыми адресами, а также находить запрещенный контент не только по доменам и IP, но и по содержанию страниц — текстам, формулировкам и другим признакам. Это может затруднить обход блокировок за счет простого переноса сайтов на новые адреса.
Отдельное внимание планируется уделить VPN-сервисам. Распространение шифрования делает традиционные методы анализа трафика менее эффективными, и алгоритмы машинного анализа позволяют точнее определять зашифрованный трафик и способы обхода ограничений. Кроме того, такие технологии могут применяться для классификации интернет-сервисов и выявления ресурсов, запрещенных в России.
В самом Роскомнадзоре отказались подробно комментировать проект. Как пишет Forbes, ранее ведомство заявило, что уже использует нейросетевые технологии для мониторинга текстовой, аудио- и визуальной информации в интернете. По утверждению представителей службы, автоматизация позволила сократить время обнаружения запрещенного контента, однако эффективность подобных систем зависит от объема данных для их обучения и остается ограниченной в отдельных направлениях.