11:00

Искатель @сокровищ
Пишет  Taho:

Google изучил эволюцию языка за двести лет

 Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований. С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет. Статья специалистов опубликована в журнале Science, а коротко о работе пишет New Scientist ( Google's 'fossil record' digitises 5 million books ).



До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту - всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов - их получилось около 500 миллиардов. Базу слов Ngrams можно найти здесь - поиск по словам осуществляется на базе алгоритмов Google.



Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое - если в 1900 году использовалось около 544 тысяч слов, то в 2000 году это число возросло до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов. 




Вот, например, изменение частоты употребления слова "амбиции" с 1920 по 2000 годы:




читать дальше

URL записи

Не свое | Не Бест? Пришли лучше!



Вопрос: Бест месяца?
1. Да! 
323  (100%)
Всего:   323
Комментарии
28.07.2011 в 11:20

Вот это интересно, а то картинки, да чьи-то выдумки...
28.07.2011 в 11:21

гармонический
замечу,кстати, что повышение графика "любовь" так или иначе связано с войном 1812 года и Первой и Второй Мировой
28.07.2011 в 11:21

Отпусти и успокойся (с)
Очень интересно! Спасибо за пост)
*ушел тестить слова*
28.07.2011 в 11:26

Добро - это когда плохому человеку делаешь плохо.
странно, что такие слова как яой и юри (это лишь несколькие из мною введенных) были популярны в россии в 18 веке, очень странно))))
28.07.2011 в 11:35

"человек - понятие растяжимое" ©
интересная форма у графика по слову "немец" за XX век
28.07.2011 в 11:36

Кто здесь, кто-кто здесь?
График слова гомосексуализм радует прям.
28.07.2011 в 11:40

I hope life isn’t a joke, because I don’t get it.
что за ересь?

28.07.2011 в 11:48

Ебашь по встречке, ебашь на красный! Садись за руль бухим! Ты ебаный гонщик! Тебя не догнать! Ты, сука, НЕУЛОВИМ!!!
Вывод напрашивается сам - это все бред.)
(к последнему посту)
28.07.2011 в 11:50

"Trust me, I'm an improviser" (c) Owen Harper
офигенская штука, если правильно использовать... у слов "товарищ" и "личность" графики почти обратные.

ngrams.googlelabs.com/graph?content=%D0%BB%D0%B...

а вы там, господа, не забыли ли базу правильную выбрать? По дефолту выбран English, надо выбирать Russian, конечно же.
28.07.2011 в 11:54

I hope life isn’t a joke, because I don’t get it.
По дефолту выбран English, надо выбирать Russian, конечно же.
да, простите, это я невнимательная, так кот выглядит совсем иначе.

1860-е были что-то сильно котовские)
28.07.2011 в 12:05

создаю островки хаоса в пучине порядка
а в начале 19-го века было много прона :3


28.07.2011 в 12:09

Прежде чем сказать правду, задумайся, а знаешь ли ты её.
А вот яой после ВОВ пошел на спад.

28.07.2011 в 12:14

атомная кукурузосажалка.
что случилось с самолётами после 1960? вошли в обыденную жизнь?

и что имели в виду до открытия синдрома Дауна в 1866 году?

28.07.2011 в 12:17

Прежде чем сказать правду, задумайся, а знаешь ли ты её.
До 1900 вообще результаты не представительны, по крайней мере в русском сегменте. Как вариант - очень мало русских книг у Гугла есть за то время.
28.07.2011 в 12:19

поищите слово "сперма". мне аж стало интересно что ж там такого в конце 30х годов было что такой всплеск интереса к этому слову появился %)
28.07.2011 в 12:26

Кстати ещё и имена можно посмотреть.
28.07.2011 в 12:35

Я знаю, что ничего не знаю (с)
знаете,в самом посте приведены слова,смысл (и употребление,моральное качество,т.п.) сильно упали.так печально.
а ещё печально то,что комментаторы тут ниже привели.прямо деградация какая-то.:depress2:
28.07.2011 в 12:50

Прежде чем сказать правду, задумайся, а знаешь ли ты её.
печеньтрески неправда, интеллект растет)

28.07.2011 в 12:52

печеньтрески , не переживайте, употребление слова "ненависть" тоже падает)
28.07.2011 в 13:00

Вы кто? -Я?Добрая фея! -А почему с топором? -Вооот, как мало вы знаете о феях!
очень интересно получается со словом космос


и фрактал)

28.07.2011 в 13:05

Я знаю, что ничего не знаю (с)
спасибо.вы меня обнадёжили :rotate:
28.07.2011 в 13:32

Если во мне живет Бог, то он в меня сослан. ©
Попробуйте на том же запросе "яой" перейти по первым ссылкам (1800-1900 годы) под фразой Search in Google Books.
У них просто наши книжки неправильно распознаны)))
Так что, думаю, результатам за 19 век можно верить с трудом ^^
28.07.2011 в 14:20

На русском какая-то чушь и вправду. Яой на английском.

28.07.2011 в 14:24

Прежде чем сказать правду, задумайся, а знаешь ли ты её.
Кадавр. И все равно заметен пик интереса около второй мировой.
28.07.2011 в 15:54

BlameMe это пошли фанфики про третий рейх
28.07.2011 в 17:09

Никаких трусиков и грудей, сэр!
В самый пик живём.

28.07.2011 в 18:52

я и мой лирический бред

28.07.2011 в 19:00

House Katsap - We do not jump
olegorlov
Он таки подкрался к нам)))
29.07.2011 в 09:20

Вы умираете - у вас мозг рака.
Супер исследование. Сама лингвист, поэтому было интересно почитать. Вообще если не искать всякую херотень, а целенаправленно изучать какой-нибудь сегмент, то можно очень интересные вещи узнать.