11:00

Искатель @сокровищ
Пишет  Taho:

Google изучил эволюцию языка за двести лет

 Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований. С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет. Статья специалистов опубликована в журнале Science, а коротко о работе пишет New Scientist ( Google's 'fossil record' digitises 5 million books ).



До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту - всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов - их получилось около 500 миллиардов. Базу слов Ngrams можно найти здесь - поиск по словам осуществляется на базе алгоритмов Google.



Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое - если в 1900 году использовалось около 544 тысяч слов, то в 2000 году это число возросло до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов. 




Вот, например, изменение частоты употребления слова "амбиции" с 1920 по 2000 годы:




читать дальше

URL записи

Не свое | Не Бест? Пришли лучше!



Вопрос: Бест месяца?
1. Да! 
323  (100%)
Всего:   323
Комментарии
29.07.2011 в 15:17

Постигшие бессмысленность печалей Растят цветы и не считают дни.
И правда - в нашей стране секса не было :)


29.07.2011 в 20:50

Все умрут, а я грейпфрут

Даже не знаю, чего ожидала
29.07.2011 в 21:01

Я знаю, что ничего не знаю (с)
17.08.2011 в 14:12

х) доставляет