Поздравляем с Новым Годом!
   
Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 8(178)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4

Библиографическое описание:
Мамаев А.Н. МЕТОДЫ ВЫЧЛЕНЕНИЯ КЛЮЧЕВЫХ СЛОВ ПРИ ОЦЕНКЕ ПОЛЬЗОВАТЕЛЬСКИХ ИНТЕРФЕЙСОВ ПРОГРАММ // Студенческий: электрон. научн. журн. 2022. № 8(178). URL: https://sibac.info/journal/student/178/242594 (дата обращения: 04.01.2025).

МЕТОДЫ ВЫЧЛЕНЕНИЯ КЛЮЧЕВЫХ СЛОВ ПРИ ОЦЕНКЕ ПОЛЬЗОВАТЕЛЬСКИХ ИНТЕРФЕЙСОВ ПРОГРАММ

Мамаев Александр Николаевич

магистрант, кафедра прикладной математики и информатики, Тольяттинский государственный университет,

РФ, г. Тольятти

Панюкова Екатерина Владимировна

научный руководитель,

канд. пед. наук. Тольяттинский государственный университет,

РФ, г. Тольятти

АННОТАЦИЯ

В статье описывается применение метода вычленения ключевых слов для исследования параметров оценки интерфейсов и алгоритмы, используемые для вычленения ключевых слов.

 

Ключевые слова: алгоритмы, анализ текста, вычленение ключевых слов,оценка пользовательского интерфейса.

 

Проблема оценки качества пользовательского интерфейса всегда стояла остро перед разработчиками, начинаю с первого программного обеспечения. На сегодняшний день можно выделить следующие методы оценки качества интерфейсов:

  • субъективный метод,
  • метод анкетирования пользователей,
  • метод быстрого прототипирования,
  • метод анализ задач,
  • экспертная оценка.

Данные методики не подходят для оценки интерфейсов программ для стартапов или программ для реализации научных задач, так как. предполагают оценку пользователей.

В рамках данной статьи будет предложена новая методика оценки интерфейсов до внедрения, т.е. до активного использования пользователями. А также на сегодняшний день ни одна предложенная методика оценки пользовательских интерфейсов не учитывает текстовую составляющую интерфейсов, а сегодня текстовая составляющая интерфейса становится не менее важной, чем и графическая, и даже появились профессии, которые отвечают за этот параметр интерфейсов:

  • SEO-копирайтеры, которые пишут тексты для поискового продвижения сайтов, учитывая требования к объёму, содержанию и ключевым словам, чтобы страницы сайта хорошо ранжировались по запросам.
  • SMM-копирайтеры, задача которых написание коротких, ёмких и цепляющих текстов для социальных сетей.
  • UX-редакторы, или редакторы интерфейсов, которые отвечают за то, чтобы все тексты в программном продукте (на сайте, лендинге или в приложении) максимально хорошо помогали пользователю достигать цели использования этого приложения.

Рассмотрим ключевые сущности предлагаемой системы.

Основными классами являются:

  • Эксперт
  • Оценка экспертов
  • Аналитик
  • Интерфейс
  • Количественные параметры интерфейсов
  • Тексты интерфейсов
  • Отчеты
  • Роли
  • Администратор

От класса Роли наследуются три класса:

  • Администратор
  • Эксперт
  • Аналитик

Администратор – имеет доступ ко всем элементам программы.

Эксперт – имеет возможность поставить оценку, т.е. оценить интерфейс с качественной точки зрения.

Аналитик – получает доступ к результатам работы системы и может работать с отчетами.

 

Рисунок 1. Диаграмма классов системы для оценки пользовательских интерфейсов

 

Класса Интерфейс включает следующие классы:

  • Оценка экспертов
  • Тексты интерфейса
  • Количественные параметры интерфейсов

В классе Оценка экспертов – хранятся оценки, полученные интерфейсом у эксперта. Один эксперт может оценить множество интерфейсов, и один интерфейс может быть оценен множеством Экспертов.

В классе Тексты интерфейса хранятся ключевые слова и тексты кнопок. Наличие данного класса позволит собирать и анализировать текстовую составляющую интерфейсов и на основе (базы знаний по другим интерфейсам, которые признаны лучшими) делать прогноз и оценку по качеству интерфейса, предложенного на оценку.

Класс Количественные параметры интерфейсов – позволит собирать информацию о количественных метриках. Наиболее распространенными эргономическими показателями качества пользовательского интерфейса являются показатели Шнейдермана:

1) скорость работы пользователя в программе до получения результата;

2) количество человеческих ошибок, допущенных пользователем в интерфейсе до получения результата;

3) субъективная удовлетворенность пользователя интерфейсом;

4) скорость обучения навыкам оперирования интерфейсом.

Класс Отчет – использует данные класса Интерфейсы и через него получает все количественные и качественные показатели.

Рассмотрим работу по выделению ключевых слов интерфейса. Ключевыми словами называются слова, обладающие рядом признаков:

  1. Слова, которые наиболее часто встречаются в тексте
  2. Слова, с помощью которых можно примерно представить смысл всего текста
  3. В рамках статьи, ключевыми словами так же будут слова кнопок и элементов интерфейса.

На текущий момент существует достаточно много различных методов разбиения текста на ключевые слова. Можно выделить два основных вида алгоритмов:

  • статистические
  • гибридные.

Рассмотрим каждый метод более подробно.

Статистический метод основан на статистике, он предполагает ранжирования всех лексем по частоте. Фильтрация заключается в отборе в качестве ключевых определенного количества наиболее частотных лексем. Этот метод является первым методом автоматического извлечения ключевых слов [1]. Данный метод наиболее прост в реализации. Недостатком данного метода, являться то, что частота употребления слова в тексте является не главным параметром.

Гибридный алгоритм – это комбинация статистического метода с лингвистическими процедурами (синтаксическим, лингвистическим, морфологическим анализом). Гибридный алгоритм включает поиск в тексте документа базовых именных групп (БИГ) с использованием морфо-синтаксического анализа на основе словарей и вычисление релевантности БИГ[2].

Существуют методы извлечения ключевых слов на основе графов [3]. Эти методы используют взвешенные графы, в вершинах у которого находятся лексемы кандидаты в ключевые слова, а вес дуг зависит от того, на сколько кандидаты близки по смыслу. Для выбора кандидатов в ключевые слова используются различные алгоритмы из теории графов. Основным отличием этих методов является применение разных методов определения кандидатов в ключевые слова и определения близости между ними. Гибридные методы дают более точные результаты, чем статистические, но при этом они более сложные.

Заключение

Сравнивая количество совпадений ключевых слов между используемым в оценки интерфейса и словами интерфейсов наиболее популярных программы, набравшими больше всего положительных оценок у экспертов или количество скачиваний на он-лайн площадках, можно примерно определить на сколько успешным будет разрабатываемый интерфейс. На основе полученных данных формируется перспектива разработки информационной системы, которая позволила бы в значительной степени повысить эффективность работы SEO-копирайтеров, SMM-копирайтеров и UX-редакторы.

 

Список литературы:

  1. Luhn H.P. A Statistical Approach to Mechanized Encoding and Searching of Literary Information. IBM Journal of Research and Development. 1957, pp. 309-310.
  2. Barker K. Cornacchia N. Using Noun Phrase Heads to Extract Document Keyphrases. Advances in Artificial Intelligence. 2000, pp. 40.
  3. Girish K.P. Keyword Extraction from a Single Document Using Centrality Measures. Pattern Recognition and Machine Intelligence. Springer Berlin Heidelberg, 2007, pp. 503-504.
  4. Шереметьева, С.О. Методы и модели автоматического извлечения ключевых слов / С.О. Шереметьева, П.Г. Осминин // Вестник ЮУрГУ. Серия «Лингвистика». – 2015. – Т. 12, № 1. – С. 76–81

Оставить комментарий