Статья опубликована в рамках: XC Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 08 июня 2020 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:

Супрыткина В.А. ИДЕНТИФИКАЦИЯ ФЕЙКОВЫХ НОВОСЕЙ В МЕДИАПРОСТРАНСТВЕ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. XC междунар. студ. науч.-практ. конф. № 6(89). URL: https://sibac.info/archive/technic/6(89).pdf (дата обращения: 01.05.2025)

Проголосовать за статью

Конференция завершена

Эта статья набрала 0 голосов

Дипломы участников

У данной статьи нет
дипломов

ИДЕНТИФИКАЦИЯ ФЕЙКОВЫХ НОВОСЕЙ В МЕДИАПРОСТРАНСТВЕ

Супрыткина Виктория Алексеевна

студент, кафедра систем информационной безопасности, Казанский Национальный Исследовательский Технический Университет имени А.Н. Туполева (КНИТУ-КАИ),

РФ, г. Казань

IDENTIFICATION OF FAKE NEWS IN THE MEDIA SPACE

Viktoria Suprytkina

student, Department of Information Security Systems, Kazan National Research Technical University named after A.N. Tupolev,

Russia, Kazan

АННОТАЦИЯ

В данной статье представлена концепция подхода к распознаванию фейковых новостей, распространяемых на базах различных веб-сайтов, исключая социальные сети. Рассматриваются некоторые существующие зарубежные и российские методы идентификации фейковых новостей. Предлагается ряд уникальных признаков фейков для их последующего использования в качестве атрибутов при машинном обучении. Формируется базовая методика распознавания фейковых новостей с использованием инструмента поддержки принятия решений и последующего реагирования на их распространение.

ABSTRACT

This article presents the concept of an approach to recognizing fake news distributed on the databases of various websites, excluding social networks. Discusses some of the existing Russian and foreign methods for the identification of fake news. A number of unique features of fakes are proposed for their subsequent use as attributes in machine learning. A basic technique for recognizing fake news is being developed using a decision support tool and subsequent response to its dissemination.

Ключевые слова: фейковые новости; интеллектуальная модель; алгоритм GLMTR; датасет

Keywords: fake news; intelligent model; GLMTR algorithm; dataset

Феномен фейковых новостей начал набирать популярность во время и по факту проведения выборов Президента Соединенных Штатов Америки в 2016 году, когда в Интернет-пространстве активно публиковались фальшивые материалы дискредитирующего характера, такие как обвинения в коррупции, скандалы [4]. В настоящее время данный термин активно используется для описания ложной информации, которая несет в себе потенциальную угрозу жизни, здоровью, безопасности человека, а также негативного вмешательства в работу предприятий, политическое и социальное устройство.

В связи с возросшей популярностью феномена зарубежные исследователи начали вести работу по разработке возможных подходов с применением интеллектуальных технологий, которые могли бы повысить эффективность идентификации фейков. Например, специалистами Массачусетского технологического института и Гарвардского университета создана нейросеть, с определенной долей точности распознающая фейки, которые формируются ботами [2] – алгоритм GLMTR (Giant Language model Test Room). Также на данный момент существуют многочисленные зарубежные датасеты (например, «Lier»), активно применяемые в основе различных работ. В частности, имеется исследование в области наиболее используемых датасетов [3, с. 30], которое направлено на их комбинирование в целях противодействия влиянию фейковых новостей в конкретной области: политика, экономика и т.д.

Борьба с фейковыми новостями в России начала набирать оборот после издания пакета законов о недостоверных новостях от 18 марта 2019 года, однако с точки зрения технологических подходов наблюдается недостаток готовых решений в области распознавания фейковых новостей. Тем не менее, в российском сегменте работа в данной области ведется. Так была разработана перспективная концепция «метода автоматизированного определения фейковых новостей для русскоязычных текстов с элементами искусственного интеллекта и машинного обучения» [1, с. 99]. В ней выделяется два отдельных модуля – новостной контент и контент социальных сетей социального контекста

Для формирования исходного набора данных для анализа вручную осуществлялся сбор соответствующих материалов с различных веб-ресурсов, по результатам которого был определен ряд признаков, которые присущи фейковым новостям. В данной статье для дальнейшего построения интеллектуальных моделей для поддержки принятия решений предлагается рассматривать следующий набор признаков: 1) полное или частичное отсутствие входных данных (обязательный минимум для публикаций – день, месяц, год и время публикации); 2) отсутствие доверенного источника информации; 3) категоричность заголовка или наличие интриги (по заголовку сложно определить конечную суть новости); 4) отсутствие гиперссылок, позволяющих подтвердить часть информации; 5) разговорный стиль описания, который не свойственен профессиональной журналистике; 6) большое количество расставленных значимых акцентов (постоянное переключение внимания между различными фактами и событиями затрудняет объективность восприятия); 7) использование несоответствующего медиа-сопровождения (фото- или видеоматериалы не соответствуют основному посылу новости).

Составленный наборов данных в основе машинного обучения может служить полезным инструментом в руках аналитика, участие которого требуется, поскольку рассматриваемые признаки не предполагают полной автоматизации процесса распознавания фейковых материалов. В совокупности с верификацией подозрительных новостей, предположительно определенных как фейк, использование инструмента поддержки принятия решений на базе данных признаков потенциально может позволить повысить эффективность их распознавания. Общая методика распознавания и реагирования на распространение фейковых новостных материалов приводится на рисунке 1.

Рисунок 1. Методика распознавания и реагирования на распространение фейковых новостей

Подобный подход подразумевает оперирование двумя базовыми категориями новостей: «ложь» и «правда». В дальнейшем перспективным видится расширение количества категорий исследуемых новостных материалов путем добавления среднего класса, который содержит в себе недостоверную информацию, возникшую в результате некорректной трактовки события и отсутствия должной верификации источника (например, к таковым относятся слухи) – такие сведения не являются фейком в полной мере, соответственно, подход к реагированию на их распространение должен быть отличным.

Список литературы:

Третьяков А.О., Филатова О.Г., Жук Д.В., Горлушкина Н.Н., Пучковская А.А. Метод определения русскоязычных фейковых новостей с использованием элементов искусственного интеллекта // International Journal of Open Information Technologies ISSN: 2307-8162 vol. 6, no.12, 2018 URL: https://cyberleninka.ru/article/n/metod-opredeleniya-russkoyazychnyh-feykovyh-novostey-s-ispolzovaniem-elementov-iskusstvennogo-intellekta (дата обращения: 02.04.2020)
Hendrik Strobelt and Sebastian Gehrmann Catching a Unicorn with GLTR: A tool to detect automatically generated text [Электронный ресурс]. – Режим доступа: http://gltr.io/ (дата обращения: 14.05.2020)
Karishma Sharma, Feng Qian, He Jiang, Natali Ruchansky, Ming Zhang, and Yan Liu Combating Fake News: A Survey on Identification and Mitigation Techniques. ACM Trans. Intell. Syst. Technol. 37, 4, Article 111 (August 2018). URL: https://arxiv.org/pdf/1901.06437.pdf (дата обращения 12.05.2020)
Mark Dice The True Story Of Fake News [Электронный ресурс]. – Режим доступа: https://www.rulit.me/programRead.php?program_id=553523&page=1 (дата обращения: 21.03.2020)