Значения слов для человека в основном продиктованы особенностями культуры, истории и географии, в которых формировался язык. То есть у одного слова не может быть одного истинного неотъемлемого значения. К такому выводу пришли исследователи Принстонского университета, которые впервые изучили десятки языков, используя методы машинного обучения, сообщает Phys.org.
«Даже у повседневных слов, которые на первый взгляд имеют одинаковое значение, существует вариативность, — отметил Уильям Томпсон, специалист по компьютерным наукам в Принстоне и один из ведущих авторов исследования. — Мы получили первые доказательства, основанные на данных, что наше восприятие мира через слова — часть культурного наследия».
Язык — это призма, через которую мы получаем понимание об окружающем мире и осмысляем его. Раньше требовалось несколько лет, чтобы изучить набор текстов с носителем одновременно двух языков. Теперь жизнь ученых упростили алгоритмы. Авторы работы проанализировали 1000 слов на 41 языке.
Вместо определения каждого слова система использует масштабный метод «семантических ассоциаций», то есть слова, близкие друг к другу. Например, английское beautiful (красивый) семантически связано с colorful (красочный), love (любовь), precious (ценный) и delicate (деликатный).
Алгоритм исследователей проанализировал миллионы семантических связей: он переводил ассоциации одного слова на другой язык, после чего повторял процесс в обратном направлении. Окончательный балл сходства значений слова выводился из количественной оценки того, насколько близко сохранялся смысл слова при переводе в двух направлениях.
Результаты показали, что существуют почти универсальные слова, в первую очередь числа, профессии, меры, даты и обозначения родства. Однако значения многих других слов, обозначающих, например, животных, еду и эмоции, сходились гораздо реже.
На последнем этапе работы авторы применили другой алгоритм, который сравнил, насколько схожи культуры, использующие два разных языка. Система основана на антропологическом наборе данных и опирается на такие вещи, как брачные практики, правовая система и политическое устройство в обществе носителей языка.
Таким образом исследователи обнаружили, что их алгоритм, основываясь на сходстве культур, может правильно предсказать, насколько легко перевести два языка. Ученые считают, что вариативность значения слов не просто случайна. Культура играет важную роль в формировании языков — ранее ученым не хватало количественных данных для подтверждения этой гипотезы.