Статья опубликована в рамках: XIX Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 17 апреля 2017 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
ПОИСК ИНФОРМАЦИИ ДЛЯ ЭЛЕКТРОННЫХ БИБЛИОТЕК И ПРАВОВЫЕ АСПЕКТЫ ФОРМИРОВАНИЯ ЭЛЕКТРОННЫХ БИБЛИОТЕК.
Электронная библиотека — упорядоченная коллекция разнородных электронных документов (в том числе книг, журналов), снабжённых средствами навигации и поиска. Может быть веб-сайтом, где постепенно накапливаются различные тексты (чаще литературные, но также научные и любые другие, вплоть до компьютерных программ) и медиафайлы, каждый из которых самодостаточен и в любой момент может быть востребован читателем [1, с. 6].
Электронные библиотеки отличаются от смежных структурных типов сайта, особенно литературного. В отличие от литературного журнала, существующего как тип печатного издания, и быстро без всяких изменений структуры перебравшегося в Интернет, электронная библиотека — это не выпуски и обновления, происходящие по принципу поступления нового материала. В отличие от тех сайтов в которых происходит свободная публикация, координатор проекта сам подбирает информацию для электронных библиотек по своему усмотрению.
Существуют различные поисковые системы, в которых можно найти множество нужных документов, книг, журналов и публикаций для электронной библиотеки.
Рассмотрим одну из самых популярных поисковых систем - Яндекс. 23 сентября 1997 года была создана данная поисковая система, которая популярна и сейчас в Российской части интернета. Автором этой поисковой системы являются Аркадий Юрьевич Волож и Илья Валентинович Сегалович. На сегодняшний день ей пользуются более 35 миллионов пользователей России и приближенных к ней стран СНГ. К 2010 году статистика показывает более 10 миллиардов оригинальных документов (страниц) с российских и зарубежных русскоязычных серверов, а также серверов на территории бывшего СССР. У данной поисковой системы развернутое формирование запроса. Так же она единственная российская поисковая система, индексирующая документы в форматах PDF, DOC, RTF, PPT, XLS и SWF. Имеет сервисные функции и показывает множество результатов при поиске графических видеофайлов.
Рассмотрим еще одну популярную поисковую систему - Google. Придумали самую популярную в мире поисковую систему в 1997 году Сергей Бирн и Лари Пейдж. Название придумано Милтоном Сироттой от искажённого слова googol, что означает обозначением чисел, состоящего из единицы и ста нулей. Исследования проводившееся на конец 2009 года определили доминирующие место, в рейтинге которого стабильно занимает 1 место компания Google. Сегодня именно Google является мировым лидером по объему проиндексированных документов (около 3 триллионов), быстро обрабатывает запросы и точность ранжирования результатов поиска. Он хорошо подходит для того, что бы выявить иллюстрацию.
Можно отметить поисковую систему Bing. Русскоязычный вариант бета-версии поисковой системы, запущенной компанией Microsoft в середине 2009 года. Еще не обладает теми преимуществами, которые позволят опередить Google. Объем индексного файла в настоящее время сопоставим с аналогичными показателями Google, но по всем остальным данным и, прежде всего, по степени определения релевантности результатов, Bing значительно уступает своему главному конкуренту. Поисковая обладает всеми стандартными возможностями, а также обладает поиском иллюстраций и видео-файлов.
Ещё одна интересная поисковая система - Rambler. Первая российская профессиональная поисковая система, работающая с 1996 года. После глобальных изменений в 2002 году данная поисковая система вновь вошла в лидеры сетевого поиска. В настоящее время объем индекса составляет порядка 150 миллионов документов. Для составления сложных запросов рекомендуется использовать режим "Детальный запрос", который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню.
Рассмотрим поисковую систему ПОИСК@mail.ru. Данный поисковый модуль компании Mail.ru запущен в 2008 году. В качестве программного "движка" используется не собственная разработка компании, а поисковый модуль Google. Это обеспечивает данной поисковой системе высокие качественные характеристики. Сбор и индексирование информации осуществляется системой самостоятельно – этим определяются разные результаты запроса в Google и ПОИСК@mail. Есть "Расширенного поиска", которая ограничивает и с лёгкостью находит определённые типы файлов (PDF, DOC, XLS, PPT).
Также выделим поисковую систему Nigma. Это экспериментальный сетевой поиск (мета-поисковая система), в основе которого применен искусственный интеллект. Nigma способна интуитивно угадывать запросы и сразу же показывать ответы без обращения к первоисточникам, решать формулы, расшифровывать сокращения, давать различные подсказки при поиске слов и предложений на английском языке Осуществляется поиск иллюстраций и аудиофайлов.
С помощью этих поисковых систем можно найти любую информацию, которой они владеют. И можно заполнить свою электронную библиотеку не только книгами, но и журналами, аудиофайлами, видеофайлами и различными картинками и т.д.
Существуют различные форматы для чтения в электронных библиотеках.
TXT-самый компактный и простой формат, был широко распространен в начале эры ЭБ, но сейчас особой популярностью не пользуется из-за низкого удобства чтения. Тем не менее, книги в этом формате до сих пор очень легко найти. Этот формат нужен тем кто экономит память устройства будет читать книги без иллюстраций, схем, таблиц, простыми словами «голый текст».
DOC-Один из самых распространенных текстовых форматов, удобный для чтения и не имеет лишнего веса. Поддерживается всеми версиями MS Office, поэтому большая часть документации хранится в этом формате. Для тех, кто хотел бы использовать электронную книгу не только для чтения художественной литературы, но и для вычитывания "рабочих" документов, отчетов, научных статей с формулами и т.п.
PDF-В этом формате чаще всего хранится научная и техническая литература, содержащая большое количество формул, схем и др. объектов, иллюстрированные книги (например, манга, комиксы), ноты и т.п. Данный формат подходит тем, кто читает много специализированной литературы (студентам, музыкантам, программистам и т.п.). Из недостатков может занимать много памяти.
EPUB-Как и PDF часто используется для хранения технической/научной литературы, но в отличие от него, гораздо компактнее. Ожидается, что со временем популярность EPUB будет только увеличиваться. Всем, кто наряду с компактностью ценит удобство чтения и читает много художественной, научной, технической, узкоспециальной литературы.
DJVU-Самый популярный формат файло-обменных сетей Рунета. Относится к графическим растровым форматам (как JPEG), в основном используется для хранения отсканированных книг, рукописей, карт, нот. Для тек кто читает много специализированной литературы.
RTF-Хорошо распространенный формат. Удобен для чтения (широкие возможности форматирования текста, иллюстрации и т.п.), но довольно "тяжелый".
FB2-самый универсальный формат. Пользуется колоссальной популярностью в Рунете по причине компактности и универсальности. Кроме того, в формат FB2 можно легко и быстро перевести книги практически любых распространенных текстовых форматов (TXT, RTF, DOC, HTML и пр.). Если книга поддерживает FB2, то с поиском литературы проблем не будет.
HTML-Традиционно используется для разметки Интернет-страниц. Электронные книги в этом формате обычно выставляются непосредственно на сайте (т.е., их можно читать без скачивания). Хорошо, если книга поддерживает данные форматы. Но, как и RTF они не являются «насущной» необходимостью.
CHM-В основном используется для файлов контекстной справки. Формат представляет собой набор HTML-страниц и занимает гораздо меньше места.
PRC, TCR-Довольно редкие форматы, разработанные специально для КПК "Palm" (PRC) и "Psion" (TCR). Без конвертации найти книги в PRC, TCR, LRF и WOLF довольно сложно. Но поскольку файлы в указанных форматах компактны и удобны для чтения, их поддержку следует отнести к достоинствам устройства.
LRF, WOLF-Специализированные форматы электронных книг "Lbook" (WOLF) и "Sony" (LRF).
И так, мы можем отметить самые удобные, практичные форматы для чтения это DOC, EPUB, DJVU и FB2. Что касается форматов "необязательных", то к ним относятся HTML, CHM, RTF и специализированные форматы PRC, TCR, LRF, WOLF.
Когда люди копируют какую-либо информацию в интернете, то многие не думают о последствиях и возможных нарушений авторских прав. Плагиат для электронных библиотеках так же является проблемой. В России существует статья УК 146 «Нарушение авторских и смежных прав», которая преследуется наказанием. Электронная информация должна быть бесплатной, доступной и не препятствовать копированию. Но и должна охраняться авторским правом для личного использования в образовательных целях. Обязательно нужно законодательно закрепить библиотеки и архивы в них для перевода в машиночитаемую форму, охраняемых авторскими правами. В России имеется федеральный закон «О библиотечном деле» (1994 г.), который устанавливает государственную политику для условия доступной информации в библиотеках, а также определяет основы библиотечных фондов. Закон РФ «Об информации, информатизации и защите информации» регулирует отдельные аспекты библиотечно-информационной деятельности, связанные с созданием и использованием баз данных, электронных каталогов и картотек. Существует антиплагиат для проверки текста, который сейчас много где используется. Данный интернет-проект был открыт с 2005 года и нужен для того, чтобы проверять текст на наличие источников из интернета. Система антиплагиата была продумана компанией Forecsys. Услуга представлена любому зарегистрированному пользователю, как платно, так и бесплатно. Нужно всегда подходить тщательно к плагиату не только в электронных библиотеках, но и вообще.
Список литературы:
- Антопольский А.Б. Электронные библиотеки: принципы создания:научно-методическое пособие /А.Б. Антопольский, Т.В. Майстрович. - Москва : Либерея-Бибинформ, 2007. - 283 с.
- Воропаев А. Н. Электронная книга и электронно-библиотечные системы России: отраслевой доклад / [Воропаев Александр Николаевич, Леонтьев Константин Борисович]; Федеральное агентство по печати и массовым коммуникациям. Упр. периодической печати, книгоиздания и полиграфии. - Москва : Федеральное агентство по печати и массовым коммуникациям, 2010. – 59 с.
- Данилина Е.А., Цапенко А.М. Авторское право в деятельности электронных библиотек:сборник статей /[сост.: Е.А. Данилина, А.М. Цапенко]; под ред. А.М. Цапенко. - Москва : ОАО ИНИЦ "Патент", 2012. – 119 с.
- Турковская, Н. В. Дистанционное обучение как новая парадигма образовательного процесса [Текст] / Н. В. Турковская // Актуальные проблемы практического применения психологии и педагогики: сб. статей междунар. науч.-практ. конф. (Воронеж, 30 ноября 2010 г.). – Воронеж: Наука-Юнипресс, 2010. – с.346-350.
- Турковская Н.В. Роль защиты информации в современном обществе [Текст] / Турковская Н.В., Вязовикова А.Д., Конфедерат А.В. // Лучшая студенческая статья - 2017: сборник статей победителей V Межунар. науч.-практ. конкурса / Под общ. ред. Г.Ю.Гуляева - Пенза: МЦНС "Наука и просвещение", 2017. - с.274-276.
дипломов
Оставить комментарий