om1.ru
Новосибирские ученые придумали, как бороться с продажей наркотиков в интернете Сотрудники лаборатории искусственного интеллекта Института систем информатики им. А. П. Ершова СО РАН создали программный продукт, способный распознавать сайты с запрещенным содержимым.

Новосибирские ученые придумали, как бороться с продажей наркотиков в интернете

Сотрудники лаборатории искусственного интеллекта Института систем информатики им. А. П. Ершова СО РАН создали программный продукт, способный распознавать сайты с запрещенным содержимым.
24 декабря 2019, 16:32

Программа новосибирских ученых может не только отделять нейтральную информацию от опасной, но и обосновывать свои выводы. Ее можно использовать для обнаружения информации, связанной с распространением наркотиков, сообщает издание «Наука в Сибири».

Сотрудники лаборатории соединили нейросети с методами экспертов по машинному обучению. Нейросети ищут контент по заданным словам, анализируют его и определяют сайты с запрещенной информацией. Плагин на платформе WordPress проверяет информацию, отфильтровывает нелегальный контент и объясняет, почему счел его таковым.

 — Идея проекта в том, что современные методы типа машинного обучения или нейронных сетей плохо справляются с поиском запрещенного контента. Злоумышленники могут использовать сленг при продаже наркотиков. Они называют их совершенно обычными словами, такими как «молоко» или «корова». Если блокировать эти слова, то будет заблокировано слишком много сайтов. Еще одна трудность — часто сообщения о продаже наркотиков размещаются на сайтах совершенно обычной тематики, например, в комментариях к новостям, — поясняет старший научный сотрудник лаборатории искусственного интеллекта ИСИ СО РАН, кандидат физико-математических наук Елена Сидорова.

Программа анализирует структуру сайта, потом с помощью словаря делает лингвистический анализ его содержимого, оценивая, связан текст с наркотиками или нет. Продукт можно установить на сервер, и он будет сканировать сайты по расписанию.

Ученые отмечают: точность выявления запрещенного контента с помощью нового сервиса составляет 86%. Программой смогут пользоваться как специализированные службы, так и пользователи интернета.

Нашли опечатку? Выделите ее и нажмите Ctrl+Enter