Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: CXXV Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 08 мая 2023 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Смиренникова А.А. ВЫБОР ОПТИМАЛЬНОЙ НЕЙРОННОЙ СЕТИ ДЛЯ КЛАССИФИКАЦИИ ИНФОПОВОДОВ СОЦИАЛЬНОЙ СЕТИ ВКОНТАКТЕ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. CXXV междунар. студ. науч.-практ. конф. № 5(123). URL: https://sibac.info/archive/technic/5(123).pdf (дата обращения: 09.01.2025)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

ВЫБОР ОПТИМАЛЬНОЙ НЕЙРОННОЙ СЕТИ ДЛЯ КЛАССИФИКАЦИИ ИНФОПОВОДОВ СОЦИАЛЬНОЙ СЕТИ ВКОНТАКТЕ

Смиренникова Арина Алексеевна

студент, кафедра информационных систем и информационной безопасности, Северный (Арктический) федеральный университет имени М.В. Ломоносова,

РФ, г. Архангельск

SELECTION OF THE OPTIMAL NEURAL NETWORK FOR CLASSIFICATION OF INFO READS OF THE VKONTAKTE SOCIAL NETWORK

 

Arina Smirennikova

Student, Department of Information Systems and Information Security, Northern (Arctic) Federal University,

Russia, Arkhangelsk

 

АННОТАЦИЯ

Социальная сеть Вконтакте является крупнейшей в России площадкой для высказывания мнений и недовольств. Были проанализированы существующие модели нейронных сетей и выбрана оптимальная для задачи классификации постов.

ABSTRACT

The social network Vkontakte is the largest platform in Russia for expressing opinions and dissatisfaction. The existing models of neural networks were analyzed and the optimal one for the task of classifying posts was chosen.

 

Ключевые слова: нейронная сеть; классификация; обработка текста.

Keywords: neural network; classification; word processing.

 

Социальные сети играют важную роль в жизни людей в России, оказывая как положительное, так и отрицательное влияние. Конкретные исследования и числа подчеркивают значимость этой темы для понимания механизмов взаимодействия людей в цифровом пространстве, а также для разработки стратегий использования социальных сетей в личных и профессиональных целях и для регулирования их деятельности.

Регулирование возможно проводить ручным трудом, но это займет огромное количество времени и ресурсов. Вместо этого можно использовать современные методы исследования - нейронные сети.

Нейронная сеть — это метод в искусственном интеллекте, который учит компьютеры обрабатывать данные таким же способом, как и человеческий мозг. Нейронные сети помогают компьютерам принимать разумные решения с ограниченным участием человека. Они могут изучать и моделировать отношения между нелинейными и сложными входными и выходными данными [1, с. 1].

Архитектура нейронных сетей повторяет структуру человеческого мозга. Клетки человеческого мозга, называемые нейронами, образуют сложную сеть с высокой степенью взаимосвязи и посылают друг другу электрические сигналы, помогая людям обрабатывать информацию.

Существует множество архитектур нейронных сетей, которые используются для задачи классификации текста. Некоторые из них:

1 . Convolutional Neural Networks (CNN) - используют сверточные слои для извлечения признаков из текста и последующей классификации.

2 . Recurrent Neural Networks (RNN) - основаны на последовательной обработке входных данных и способны учитывать контекст предыдущих слов при классификации.

3. Long Short-Term Memory (LSTM) — это разновидность RNN, которая помогает сохранять долгосрочную зависимость в последовательности данных и избежать проблемы затухающего градиента [2, с. 2].

Для классификации инфоповодов лучшим решением будет CNN, так как она лучше подходит для обработки коротких текстов и быстрее в обучении, чем RNN. Также CNN может дать лучшие результаты, если задача классификации текста требует анализа локальных признаков в тексте.

Нейронная сеть поддастся любому программисту, если в его работе будет задействована подходящая библиотека. Библиотека — это набор готовых решений по программированию. Чтобы не программировать какой-то функционал с нуля для своей программы, программист просто подключает его в виде готовой библиотеки.

Существует множество библиотек для глубокого и машинного обучения, которые могут использоваться для задачи классификации текста. Некоторые из них:

1. TensorFlow - библиотека с открытым исходным кодом для глубокого обучения, разработанная Google (По требованию Роскомнадзора информируем, что иностранное лицо, владеющее информационными ресурсами Google является нарушителем законодательства Российской Федерации – прим. ред.). Она имеет множество инструментов для создания и обучения моделей машинного обучения, включая модели для классификации текста.

2. PyTorch - библиотека глубокого обучения, разработанная Facebook (Facebook, согласно судебному решению, в России признана экстремистской организацией - прим. Редакции). Она позволяет создавать и обучать различные модели машинного обучения, включая модели для классификации текста.

3. Keras - это высокоуровневая библиотека глубокого обучения, написанная на языке Python, которая может работать поверх TensorFlow или других фреймворков глубокого обучения. Она предоставляет простой и интуитивно понятный интерфейс для создания различных моделей машинного обучения, включая модели для классификации текста.

4 . Scikit-learn - библиотека машинного обучения на языке Python, которая предоставляет инструменты для создания и обучения различных моделей машинного обучения, включая модели для классификации текста [3, с. 3].

Для классификации текстовых данных на несколько категорий, наиболее эффективной является библиотека PyTorch, так как она является наиболее проработанной в области классификации текста, имея огромное количество методов.

Требования к модели глубокого обучения для классификации текста могут быть различными в зависимости от конкретной задачи и условий её решения. Ниже приведен список наиболее распространённых требований к модели для классификации текста:

1. Высокая точность: модель должна давать точные результаты на тестовых данных.

2. Быстрая скорость работы: модель должна быть быстрой и эффективной в работе с большими объемами данных.

3. Способность работать с разными языками: модель должна быть способна обрабатывать текст на различных языках и учитывать языковые особенности.

4. Работа с различными типами текста: модель должна уметь работать с текстом различных типов, таких как новости, социальные сообщения, научные статьи и так далее.

5. Способность к обучению на размеченных данных: модель должна быть способна обучаться на больших объемах размеченных данных.

6. Устойчивость к шуму: модель должна быть устойчива к шуму и нечистотам в данных.

В случае исследования важными требованиями для будущей нейронной сети будут следующими: высокая точность, работа только с русским языком, способность обучения на размеченных данных, запись в csv файл с новым столбцом.

Таким образом были выбраны все необходимые параметры модели нейронной сети для классификации инфоповодов социальной сети Вконтакте. После выгрузки данных из групп будет производиться обработка полученной нейронной сети.

 

Список литературы:

  1. Что такое нейронная сеть. [электронный ресурс] — Режим доступа. — URL: https://aws.amazon.com/ru/what-is/neural-network/ (дата обращения 30.04.2023)
  2. 7 архитектур нейронных сетей для решения задач NLP. [электронный ресурс] — Режим доступа. — URL: https://neurohive.io/ru/osnovy-data-science/7-arhitektur-nejronnyh-setej-nlp/ (дата обращения 30.04.2023)
  3. Библиотеки Python для нейронных сетей. [электронный ресурс] — Режим доступа. — URL: https://otus.ru/nest/post/738/ (дата обращения 30.04.2023)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий