Средства массовой информации, интернет-платформы и социальные сети предоставляют многообразие текстов, формирующих в обществе определенное восприятие мира, что оказывает воздействие на когнитивные и речевые процессы носителей языка. В медиатекстах встречаются метаязыковые высказывания, являющиеся речевой формой, в рамках которой язык становится объектом рефлексии. Такие высказывания не просто передают информацию, но и осуществляют её интерпретацию, оценку и тем самым оказывают манипулятивное воздействие.
Большая языковая модель (Large Language Model, LLM) представляет собой разновидность искусственного интеллекта, подготовленного к работе с текстовой информацией за счет обучения на больших объемах текстовых данных.
Процесс обучения больших языковых моделей требует огромных вычислительных ресурсов и больших объемов данных. Модели обучаются на материалах, собранных из различных источников, таких как интернет, книги, статьи и другие текстовые данные. В ходе обучения модели адаптируются к сложностям естественного языка, выявляют структуру, семантику и контекст, что позволяет им генерировать тексты высокого качества и выполнять различные задачи, связанные с обработкой естественного языка.
Большие языковые модели могут быть применены в различных областях, таких как машинный перевод, автоматическая генерация текста, обработка естественного языка, анализ текстов и многое другое. Они используются в разработке различных персональных помощников, систем автоматического ответа на вопросы, генерации контента для веб-сайтов, а также в различных научных исследованиях в области лингвистики и искусственного интеллекта.
С помощью больших языковых моделей возможны сравнительные исследования метаязыковой деятельности носителей языка, а полученные данные могут дать представление о том, какие изменения происходят в национальных языковых картинах мира.
В процессе нашего исследования осуществляется анализ текстов, содержащих метаязыковые высказывания, с использованием методов обработки естественного языка (NLP). Большие языковые модели помогают выявить общие и индивидуально- авторские черты метаязыковой деятельности носителей разных языков и культур.
Модели предлагается задача обнаружить метаязыковые высказывания и проанализировать метакомпоненты в контекстах из медиа-дискурса. Для точности ответов сформулирована следующая структура запроса: «Выдели из данного контекста метаязыковые высказывания, которые предполагают субъективно-авторский комментарий к изображаемым событиям и фактам. Выдели в них значимые компоненты и проанализируй их с точки зрения функции в данном высказывании. Учитывая, что структурно-семантическим компонентом метаязыковых высказываний являются метаоператоры, к которым относятся глаголы и существительные, обозначающие речевые и интеллектуальные действия, а также лексическая единица «слово».
Рассмотрим анализ высказывания на примере:
«Слово «миф» для многих значит нечто отвлеченное от реальности, существующее лишь в идеях и словах. Да, отчасти это так. Именно на словах ведет дебаты некоторая часть нашей общественности, в сознании каковой ясно проступают либо про-, либо антизападные установки. Но антрополог с культурологом скажут, что миф существует не только как идея, он управляет социумом и через действия. Это происходит посредством ритуалов, то есть неких особенных действий, смысл которых состоит в разыгрывании мифа как драмы. Суть мифа открывается в ритуале, суть ритуала скрыта в мифе» (novgaz. com).
GPT-4 выдает следующее:
I. «Метаязыковые высказывания, предполагающие субъективно-авторскийкомментарий:
1. «Слово «миф» для многих значит нечто отвлеченное от реальности, существующее лишь в идеях и словах».
2.«Да, отчасти это так».
3. «Именно на словах ведет дебаты некоторая часть нашей общественности. . . ».
II. Компоненты:
- «Слово» – лексическая единица.
- «значит» – глагол интеллектуального действия.
- «существующее» – глагол, обозначающий состояние или процесс.
- «Да» – утвердительное частица, подтверждающая авторское мнение.
- «отчасти» – наречие, указывающее на частичное согласие автора.
- «Именно на словах» – упоминание «слово» как метаязыкового компонента.
- «ведет дебаты» – глагол речевого действия.
III. Анализ функции компонентов:
1.1. «Слово» – акцент на определенной лексической единице и ее интерпретации.
- «значит» – указание на значение слова и его трактовку.
- «существующее» – обозначение особенности мифа как чего-то имеющегося в сознании.
- «Да» – автор подтверждает чью-то точку зрения.
- «отчасти» – автор согласен, но не полностью, с предыдущим утверждением.
3.1. «Именно на словах» – подчеркивание роли языка в формировании мнений.
3.2. «ведет дебаты» – обозначает активное речевое взаимодействие общества
и его основание на словесных поединках.
Таким образом, в выделенных метаязыковых высказываниях автор выражает свою точку зрения относительно того, как воспринимается и обсуждается миф в обществе». Как видим, модель дает подробный анализ метавысказываний, которые ей удалось распознать, поэтому сгенерированный ответ можно считать удовлетворительным. Однако в предложенном контексте было пропущено метавысказывание «Но антрополог с культурологом скажут, что миф существует не только как идея, он управляет социумом и через действия». Здесь представлен метаоператор «но антрополог с культурологом скажут», фиксирующий интерпретацию понятия «миф» с точки зрения профессиональной деятельности говорящих.
Таким образом, использование языковых моделей в сфере лингвистических исследований может автоматизировать многие процессы, что значительно ускорит аналитическую работу и даст исследователю возможность обрабатывать большие объемы данных.
Библиографический список - David J. Lobina What can Large Language Models offer to linguists? // [Электронный ресурс]. Режим доступа: https://blog. oup. com/2023/06/what-can- large-language-models-offer-to-linguists/
- Ryan M. Nefdt Real patterns and the structure of language // [Электронный ресурс]. Режим доступа: https://blog. oup. com/2023/06/real-patterns-and-the-structure-of- language/