Google Books насчитал во всем мире 129 864 880 книг

Однозначно, Google Books является самым передовым проектом в попытках Google каталогизировать и проиндексировать каждую частичку данных на Земле. Ведь письменности не так уж и много лет, каких-то пять или шесть тысяч, что делает эту задачу вполне выполнимой. =)
Проект этот интересен по нескольким причинам, как социальным так и технологическим. Польза от создания глобальной базы всей мировой литературы несоизмерима, однако методы используемые Google являются захватывающим сочетанием истории и высоких технологий.
Вот что написано по этому поводу в блоге команды Google Books:
«Наша цель близка к цели ISBN (International Standard Book Numbers, возьмите любую книгу, и посмотрите на первой странице, наверняка вы увидите там надпись вроде ISBN номер такой-то). Однако же система эта была создана в начале 60-х, а была введена лишь в середине 70-х годов прошлого века. К тому же она распространена в основном на западе, и многие книги напечатанные до 60-х годов, либо в других странах — никогда не попадут в эту систему. Иногда один и тот же номер ISBN присваивается множеству разных книг, например нам встречалось от 2 до 1500 книг с одним и тем же номером. И хотя целью ISBN является создание каталога книг и подобных продуктов, номера ISBN часто присваиваются всему подряд, от компакт-дисков до футболок.
Итак, чем же мы занимаемся? Мы собираем данных из многих источников (более 150, и это число растет) в которых входят различные библиотеки, каталоги WorldCat, каталоги различных стран и издателей. На данный момент у нас около миллиарда уникальных необработанных записей. Затем мы анализируем полученные данные, чтобы снизить уровень повторяющихся книг, что приводит нас к цифре приблизительно в 600 миллионов книг.»
Означает ли это, что в мире 600 миллионов различных книг? Вряд ли. Велико количество повторов как среди одного источника, так и среди различных источников, к примеру у нас есть 96 записей из 46 источников для книги «Программируем на Перл, 3-е издание». Часто отличить одну книгу от другой можно лишь посмотрев на ее обложку.
После всего этого, у вас может возникнуть вопрос: Так сколько же книг во всем мире?
Ответ меняется каждый день, по мере того как в Google добавляются все новые и новые книги. На данный момент, это около 146 миллионов книг. Но на этой цифре работа специалистов Google не заканчивается:
«Затем нам необходимо разобраться с маркировкой изданий, которая может широко различаться в различных заведениях, например «том 325, номер 6», «ном.325, секция 6» и «Т325НО6» означают одну и ту же книгу. На данный момент мы имеем данные о 16 миллионах дубликатов в базе данных. Вычитая это мы получаем цифру в 129 864 880 книг.»
Конечно перспектива создания одной корпорацией глобальной базы данных обо всем на земле немного пугает. С другой стороны, этот проект является самым открытым и доступным из всех разработок Google. Да, Google размещает рекламу в каталогах, дает ссылки на продавцов книг, куда же без этого, но возможность прикоснуться к тому, что лишь несколько лет назад было привилегией нескольких избранных — это Очень Хорошая Вещь!
| «Классико» – это косметический салон в Одессе, предлагающий услуги визажиста, парикмахера, маникюриста, косметолога. Просторные залы, приветливые мастера ждут вас. |
