Style hi tech

Ежедневные обзоры гаджетов

Google Books насчитал во всем мире 129 864 880 книг

Google Books насчитал во всем мире 129 864 880 книг

Однозначно, Google Books является самым передовым проектом в попытках Google каталогизировать и проиндексировать каждую частичку данных на Земле. Ведь письменности не так уж и много лет, каких-то пять или шесть тысяч, что делает эту задачу вполне выполнимой. =)


Проект этот интересен по нескольким причинам, как социальным так и технологическим. Польза от создания глобальной базы всей мировой литературы несоизмерима, однако методы используемые Google являются захватывающим сочетанием истории и высоких технологий.

Вот что написано по этому поводу в блоге команды Google Books:
«Наша цель близка к цели ISBN (International Standard Book Numbers, возьмите любую книгу, и посмотрите на первой странице, наверняка вы увидите там надпись вроде ISBN номер такой-то). Однако же система эта была создана в начале 60-х, а была введена лишь в середине 70-х годов прошлого века. К тому же она распространена в основном на западе, и многие книги напечатанные до 60-х годов, либо в других странах — никогда не попадут в эту систему. Иногда один и тот же номер ISBN присваивается множеству разных книг, например нам встречалось от 2 до 1500 книг с одним и тем же номером. И хотя целью ISBN является создание каталога книг и подобных продуктов, номера ISBN часто присваиваются всему подряд, от компакт-дисков до футболок.

Итак, чем же мы занимаемся? Мы собираем данных из многих источников (более 150, и это число растет) в которых входят различные библиотеки, каталоги WorldCat, каталоги различных стран и издателей. На данный момент у нас около миллиарда уникальных необработанных записей. Затем мы анализируем полученные данные, чтобы снизить уровень повторяющихся книг, что приводит нас к цифре приблизительно в 600 миллионов книг.»

Означает ли это, что в мире 600 миллионов различных книг? Вряд ли. Велико количество повторов как среди одного источника, так и среди различных источников, к примеру у нас есть 96 записей из 46 источников для книги «Программируем на Перл, 3-е издание». Часто отличить одну книгу от другой можно лишь посмотрев на ее обложку.

После всего этого, у вас может возникнуть вопрос: Так сколько же книг во всем мире?

Ответ меняется каждый день, по мере того как в Google добавляются все новые и новые книги. На данный момент, это около 146 миллионов книг. Но на этой цифре работа специалистов Google не заканчивается:

«Затем нам необходимо разобраться с маркировкой изданий, которая может широко различаться в различных заведениях, например «том 325, номер 6», «ном.325, секция 6» и «Т325НО6» означают одну и ту же книгу. На данный момент мы имеем данные о 16 миллионах дубликатов в базе данных. Вычитая это мы получаем цифру в 129 864 880 книг.»

Конечно перспектива создания одной корпорацией глобальной базы данных обо всем на земле немного пугает. С другой стороны, этот проект является самым открытым и доступным из всех разработок Google. Да, Google размещает рекламу в каталогах, дает ссылки на продавцов книг, куда же без этого, но возможность прикоснуться к тому, что лишь несколько лет назад было привилегией нескольких избранных — это Очень Хорошая Вещь!


«Классико» – это косметический салон в Одессе, предлагающий услуги визажиста, парикмахера, маникюриста, косметолога. Просторные залы, приветливые мастера ждут вас.

Комментирование закрыто.