PR Drive
19 ноября 2024
Анализ метаязыковых высказываний с использованием NLP систем

Аукатова Л.С.

студент

Казахстанский филиал МГУ имени М.В.Ломоносова г. Астана, Казахстан aukatova.linara@mail.ru

Средства массовой информации, интернет-платформы и социальные сети предоставляют многообразие текстов, формирующих в обществе определенное восприятие мира, что оказывает воздействие на когнитивные и речевые процессы носителей языка. В медиатекстах встречаются метаязыковые высказывания, являющиеся речевой формой, в рамках которой язык становится объектом рефлексии. Такие высказывания не просто передают информацию, но и осуществляют её интерпретацию, оценку и тем самым оказывают манипулятивное воздействие.

Большая языковая модель (Large Language Model, LLM) представляет собой разновидность искусственного интеллекта, подготовленного к работе с текстовой информацией за счет обучения на больших объемах текстовых данных.

Процесс обучения больших языковых моделей требует огромных вычислительных ресурсов и больших объемов данных. Модели обучаются на материалах, собранных из различных источников, таких как интернет, книги, статьи и другие текстовые данные. В ходе обучения модели адаптируются к сложностям естественного языка, выявляют структуру, семантику и контекст, что позволяет им генерировать тексты высокого качества и выполнять различные задачи, связанные с обработкой естественного языка.
Большие языковые модели могут быть применены в различных областях, таких как машинный перевод, автоматическая генерация текста, обработка естественного языка, анализ текстов и многое другое. Они используются в разработке различных персональных помощников, систем автоматического ответа на вопросы, генерации контента для веб-сайтов, а также в различных научных исследованиях в области лингвистики и искусственного интеллекта.

С помощью больших языковых моделей возможны сравнительные исследования метаязыковой деятельности носителей языка, а полученные данные могут дать представление о том, какие изменения происходят в национальных языковых картинах мира.

В процессе нашего исследования осуществляется анализ текстов, содержащих метаязыковые высказывания, с использованием методов обработки естественного языка (NLP). Большие языковые модели помогают выявить общие и индивидуально- авторские черты метаязыковой деятельности носителей разных языков и культур.

Модели предлагается задача обнаружить метаязыковые высказывания и проанализировать метакомпоненты в контекстах из медиа-дискурса. Для точности ответов сформулирована следующая структура запроса: «Выдели из данного контекста метаязыковые высказывания, которые предполагают субъективно-авторский комментарий к изображаемым событиям и фактам. Выдели в них значимые компоненты и проанализируй их с точки зрения функции в данном высказывании. Учитывая, что структурно-семантическим компонентом метаязыковых высказываний являются метаоператоры, к которым относятся глаголы и существительные, обозначающие речевые и интеллектуальные действия, а также лексическая единица «слово».

Рассмотрим анализ высказывания на примере: «Слово «миф» для многих значит нечто отвлеченное от реальности, существующее лишь в идеях и словах. Да, отчасти это так. Именно на словах ведет дебаты некоторая часть нашей общественности, в сознании каковой ясно проступают либо про-, либо антизападные установки. Но антрополог с культурологом скажут, что миф существует не только как идея, он управляет социумом и через действия. Это происходит посредством ритуалов, то есть неких особенных действий, смысл которых состоит в разыгрывании мифа как драмы. Суть мифа открывается в ритуале, суть ритуала скрыта в мифе» (novgaz. com).

GPT-4 выдает следующее:

I. «Метаязыковые высказывания, предполагающие субъективно-авторскийкомментарий:
1. «Слово «миф» для многих значит нечто отвлеченное от реальности, существующее лишь в идеях и словах».
2.«Да, отчасти это так».
3. «Именно на словах ведет дебаты некоторая часть нашей общественности. . . ».

II. Компоненты:
  1. «Слово» – лексическая единица.
  2. «значит» – глагол интеллектуального действия.
  3. «существующее» – глагол, обозначающий состояние или процесс.
  4. «Да» – утвердительное частица, подтверждающая авторское мнение.
  5. «отчасти» – наречие, указывающее на частичное согласие автора.
  6. «Именно на словах» – упоминание «слово» как метаязыкового компонента.
  7. «ведет дебаты» – глагол речевого действия.

III. Анализ функции компонентов:

1.1. «Слово» – акцент на определенной лексической единице и ее интерпретации.
  1. «значит» – указание на значение слова и его трактовку.
  2. «существующее» – обозначение особенности мифа как чего-то имеющегося в сознании.
  3. «Да» – автор подтверждает чью-то точку зрения.
  4. «отчасти» – автор согласен, но не полностью, с предыдущим утверждением.
3.1. «Именно на словах» – подчеркивание роли языка в формировании мнений.
3.2. «ведет дебаты» – обозначает активное речевое взаимодействие общества
и его основание на словесных поединках.

Таким образом, в выделенных метаязыковых высказываниях автор выражает свою точку зрения относительно того, как воспринимается и обсуждается миф в обществе». Как видим, модель дает подробный анализ метавысказываний, которые ей удалось распознать, поэтому сгенерированный ответ можно считать удовлетворительным. Однако в предложенном контексте было пропущено метавысказывание «Но антрополог с культурологом скажут, что миф существует не только как идея, он управляет социумом и через действия». Здесь представлен метаоператор «но антрополог с культурологом скажут», фиксирующий интерпретацию понятия «миф» с точки зрения профессиональной деятельности говорящих.
Таким образом, использование языковых моделей в сфере лингвистических исследований может автоматизировать многие процессы, что значительно ускорит аналитическую работу и даст исследователю возможность обрабатывать большие объемы данных.

Библиографический список
  1. David J. Lobina What can Large Language Models offer to linguists? // [Электронный ресурс]. Режим доступа: https://blog. oup. com/2023/06/what-can- large-language-models-offer-to-linguists/
  2. Ryan M. Nefdt Real patterns and the structure of language // [Электронный ресурс]. Режим доступа: https://blog. oup. com/2023/06/real-patterns-and-the-structure-of- language/
Из сборника докладов XIX Международной научной конференции студентов, магистрантов и молодых ученых «ЛОМОНОСОВ – 2024», 19-20 апреля 2024 года