Вы, наверное, слышали о такой вещи как Гугл Букс? Кто не знает, это такой читальный зал с гигантскими, с позволения сказать, авуарами книг. Так вот, на основе этой электронной библиотеки создан сервис Google Ngram Viewer с помощью которого вы сможете построить график частоты упоминания того или другого слова в литературе. Можно выбрать временной интервал от 1500 г. до 2008 г. Не спрашивайте почему так. К 1500-му году уже 60 лет изобретению Гутенберга, китайцы же хитро щурясь печатают 600 лет, ну или около того. Представленные языки это: английский, китайский, русский, французский, немецкий, иврит и испанский. Короче, почти что языки мирового значения если иврит заменить на арабский, а итальянский на португальский.
Самое вкусное – это разбивка по годам и возможность сравнивать полученные графики.
Вот, например, мне было интересно сравнить упоминание слов «Russia», «USSR», «Moscow» в англоязычной литературе.
Читать дальше »