Ученые сравнили особенности интонации в разговорной речи с отдельным языком

Особенности человеческой речи вроде интонации, скорости и ритма можно воспринимать отдельной системой знаков с собственным словарем, семантикой и синтаксисом. Система существует по собственным законам, напоминающим синтаксис самостоятельного языка, заявили авторы исследования, опубликованного в научном журнале PNAS (Proceedings of the National Academy of Sciences). На исследование обратило внимание научно-популярное издание Naked Science.

Группа ученых из Израиля и США изучали просодию — систему фонетических средств, (таких как интонация, ритм, темп, длительность звуков), дополняющую устную речь и обычно не отображаемую на письме. Благодаря просодии люди способны отличить вопрос от восклицания, не спутать шутку с серьезным высказыванием, правильно считывать отношение говорящего к предмету обсуждения, пишет Naked Science.

Авторы научной работы проанализировали два «больших массива спонтанных разговоров» на английском языке и материал трех аудиокниг. Затем ученые сгруппировали похожие фрагменты речи, составив «просодический словарь».

Блогеры штампуют видео с помощью ИИ и не проверяют факты. Чем опасен этот контент и как защитить себя?
Интернет и мемы15 минут чтения

Им удалось составить перечень из примерно 200 паттернов. Это гораздо меньше, чем тысячи слов базового словарного запаса, уточнили исследователи. «Точно так же, как синтаксис управляет сочетаниями слов, мы наблюдаем повторяющиеся структуры, где одни закономерности следуют за другими чаще, чем случайно. Такие вездесущие пары не были обнаружены в письменной речи», — сообщили авторы публикации.

Ученые назвали найденные паттерны «строительными блоками просодического словаря», описали их свойства и диапазон значений. Каждый паттерн представляет собой своеобразную короткую «мелодию», играющую роль слова, составной части более длинных «фраз».

Исследователи описали логику, которая объединяет «строительные блоки» в связные высказывания, и заявили, что их работа может стать основой подобных исследований для других языков.

Попробуйте отличить нейросеть от реальных фото в тесте «Холода»
Интернет и мемы2 минуты чтения

Кроме того, материал исследования можно использовать для обучения моделей искусственного интеллекта разным языкам без использования слов, предположили ученые.

Существующие модели искусственного интеллекта работают, используя предположение, что слова в человеческом языке выстраиваются в словосочетания и предложения, подчинясь статистическим закономерностям. Нейросети ищут эти закономерности в существующих онлайн текстах и уже на их основе генерируют собственные последовательности слов, пишет Naked Science.

В марте самым скачиваемым мобильным приложением в мире стал чат-бот с генеративным искусственным интеллектом ChatGPT. Программу за месяц установили 46 миллионов раз. Чат-бот нейросети впервые в истории обогнал другие приложения, до него топ скачиваний возглавляли Instagram и TikTok. 

Чтобы не пропускать главные материалы «Холода», подпишитесь на наши социальные сети!