РепТеч — новости технологий

  • Главная
  • Карта сайта

11

Апр

Google изучил эволюцию языка за двести лет

Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований. С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет.

До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту — всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов — их получилось около 500 миллиардов. Базу слов Ngrams можно найти здесь — поиск по словам осуществляется на базе алгоритмов Google.

Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое — если в 1900 году использовалось около 544 тысяч слов, то в 2000 году эта цифра возросла до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов.

Кроме того, специалисты изучили, как сказывалась на использовании тех или иных слов цензура. Ученые установили, что после 1989 года словосочетание «площадь Тяньаньмень» практически перестало встречаться в литературе, изданной в Китае. То же самое произошло с именем Лев Троцкий в СССР в 1940-е годы и с именами голливудских актеров, уличенных в связях с Советским Союзом в США.

Авторы и их коллеги полагают, что новый инструмент позволит ученым исследовать слова и лингвистические тенденции, используя те же подходы и методы, что и специалисты по естественным наукам.

Читайте также: Новости России и мира.

Возможно заинтересует:

  • Плазмонные нанопузырьки помогут уничтожить раковые клетки
  • Индия заявила о своем первенстве в ряде важных открытий
  • Парад под метеорным дождем
  • Микропроцессор нового поколения сделает смартфоны доступными
  • Японская армия показала робота-шпиона

Свежие записи

  • Плазмонные нанопузырьки помогут уничтожить раковые клетки
  • Индия заявила о своем первенстве в ряде важных открытий
  • Парад под метеорным дождем
  • Микропроцессор нового поколения сделает смартфоны доступными
  • Японская армия показала робота-шпиона

Архивы

  • Май 2025
  • Апрель 2025
  • Март 2025
  • Февраль 2025
  • Январь 2025
  • Декабрь 2024
  • Ноябрь 2024
  • Октябрь 2024
  • Сентябрь 2024
  • Август 2024
  • Июль 2024
  • Июнь 2024
  • Май 2024
  • Апрель 2024

Последние записи

  • Плазмонные нанопузырьки помогут уничтожить раковые клетки
  • Индия заявила о своем первенстве в ряде важных открытий
  • Парад под метеорным дождем
  • Микропроцессор нового поколения сделает смартфоны доступными
  • Японская армия показала робота-шпиона
  • Эти захватывающие дух русские изображения Земли…
  • Найдена уязвимость в личных сообщениях в Twitter
  • Последователи Radiohead – бесплатная музыка становится модной?
  • Галлюцинационная система России оказалась неэффективной
  • НАСА вложит 270 млн. $ в частные космические корабли.
  • Случайные записи

    • Google Chrome OS получит бизнес-версию
    • Сбившая спутник Земли ракета попала на видео
    • СМИ: МИД Израиля приостановил поставку БПЛА Украине
    • Собянина обвинили в плагиате диссертации
    • Частный космос постигла новая катастрофа
    • Лунный лифт к 2020 году
    • Создан читающий мысли прибор
Все права защищены © 2025 РепТеч — новости технологий.