Самые популярные слова, используемые в социальных сетях

Вы когда-нибудь задумывались о языке, используемом в социальных сетях? Или работа, которую мы используем, основана на наших личностных качествах? Если ваш ответ утвердительный, вам повезло.



Задний план

В Центр позитивной психологии на базе Пенсильванского университета создали то, что известно как Проект мирового благополучия (WWBP). Этот удивительный проект разрабатывает научные методы измерения психологического благополучия и физического здоровья на основе анализа языка в социальных сетях. Лучшие специалисты по информатике, психологи и статистики вместе обсуждают психосоциальные процессы, влияющие на здоровье и счастье, и изучают возможности замены дорогостоящих методов обследований. В 2013 году WWBP опубликовал изучение под названием «Личность, пол и возраст на языке социальных сетей: подход открытого словарного запаса». В одном из крупнейших на сегодняшний день исследований WWBP проанализировал более 700 миллионов слов, фраз и тематических примеров, собранных из сообщений Facebook 75 000 добровольцев. Чтобы проанализировать сообщения, они использовали два разных метода для поиска демографических и психологических атрибутов:

  • Дифференциальный языковой анализ (DLA): метод, разработанный WWBP для выявления наиболее отличительных языковых функций по любому заданному атрибуту.
  • Лингвистический запрос и подсчет слов (LIWC): популярный инструмент, используемый в психологии для поиска способов использования слов людьми в повседневной жизни. Это может предоставить обширную информацию об их убеждениях, страхах, образцах мышления, социальных отношениях и личностях.

В этом конкретном исследовании WWBP также попросил добровольцев пройти стандартные личностные тесты (модель «Большой 5 факторов») для определения слов, используемых в определенных личностных качествах. Объедините все это, и они смогли связать язык социальных сетей с личностью, полом и возрастом с точностью 91,9%. Теперь давайте запачкаем руки и посмотрим, как они собирали обновления статуса Facebook и составляли свои диаграммы визуализации.



Данные

Полный набор данных состоял примерно из 19 миллионов обновлений статуса Facebook, написанных всеми участниками. Команда WWBP ограничила свой анализ теми пользователями Facebook, которые соответствуют 4 определенным критериям:

  • Они должны указать английский как основной язык
  • Написали не менее 1000 слов в своих обновлениях статуса
  • Быть моложе 65 лет
  • Укажите пол (мужской и женский) и возраст

Язык пола:

язык социальных сетей

Особенности женского языка показаны вверху, а особенности мужского языка - ниже. S размер слова указывает на силу корреляции; в Цвет указывает относительную частоту использования. Подчеркивание (_) соединять слова из многословных фраз.

  • Самки из этого исследования (вверху), используется больше слов об эмоциях (например, возбужденный) и единственного числа от первого лица, а также упоминается больше психологических и социальных процессов (например, «люблю тебя» и «<3’ –a heart).
  • Болезни использовал больше нецензурных слов и ссылок на объекты (например, «xbox», «black ops», «желает он»).

Язык возраста:

язык социальных сетей

Как вы можете видеть на Рисунке 3 выше, есть небольшие изменения тем, переходящие от одной возрастной группы к другой. Кроме того, есть четкие различия в словах, таких как использование сленга, смайликов и интернет-разговоров в От 13 до 18 лет . в От 23 до 29 лет , вы можете увидеть пару Интернет говорят или рабочие темы (например, «на работе», «новая работа»). Мы видим школа связанная тема для От 13 до 18 лет (например, «школа», «домашнее задание», «тьфу»), когда мы видим колледж связанная тема для От 19 до 22 лет (например, «семестр», «колледж», «регистр»). По мере продвижения к От 30 до 65 лет используемые слова больше ориентированы на эмоциональную стабильность в отношениях с семьей и друзьями (например, «дочь», «мой сын», «мои дети» и «мои друзья из Facebook»). В целом, вы увидите прогрессию в школе, колледже, работе и семье, если посмотрите на основные темы во всех возрастных группах.



Стандартная частота тем и слов в зависимости от возраста: язык социальных сетей

В Рис. 4A , график показывает относительную частоту наиболее избирательных тем для каждой возрастной группы в зависимости от возраста. Рис. 4B подкрепляет эту гипотезу, представляя аналогичную модель, основанную на других социальных темах. Рис. 4C показывает, что использование слова «мы» увеличивается после 22 лет, тогда как «я» уменьшается. Это определенно указывает на возрастающее значение дружбы и отношений с возрастом.

Язык личности:

Исследователи выяснили, как совпадают наш язык и личность. Они проанализировали слова, используемые участниками, и систематизировали их в зависимости от личности каждого участника. Вот несколько слов о пяти личностных факторах:

  • Экстраверсия: описывает, как вы взаимодействуете с людьми.
  • Невротизм: как справляться с эмоциями
  • Доброжелательность: как вы относитесь к другим
  • Добросовестность: описывает, насколько вы организованы и надежны.
  • Открытость: это когда кто-то любопытен и открыт для нового опыта и знаний.
язык социальных сетей язык социальных сетей

В левом верхнем углу мы видим, что социально связанные категории, такие как партия темы становятся ключевой отличительной чертой для Экстраверты . Кроме того, результаты показывают, что Интроверты интересуются японскими СМИ (например, 'аниме', 'манга', 'Интернет' и смайлики в японском стиле: ˆ_ˆ). В левом нижнем углу Рисунка 5 показано, что люди Высокий невротизм часто упоминаемые фразы, такие как «надоело», «подавлен» и «ненавижу». В правом нижнем углу показан язык, связанный с эмоциональной стабильностью ( Низкий невротизм ). Низкий невротический люди писали о приятных социальных мероприятиях, которые способствуют гармонии или создают больший эмоциональный баланс, таких как «спорт», «отпуск», «пляж», «церковь», «команда» и время для семьи тема. На рисунке 6 ниже (внизу справа) люди, отображающие Низкая открытость используйте сокращенные слова при обновлении статуса (например, «2day», «ur», «every 1»). Люди, которые High Open (внизу слева) используйте творческие слова (например, «искусство», «вселенная», «музыка», «письмо» и «душа»). Вы можете не резонировать с этим, но Низкая сознательность люди (в центре слева) используют очень явные слова в своих обновлениях, тогда как Высокая сознательность люди (в центре слева) используют фразы (например, «работать», «готов к» и «великий день»). Как видите, платформы социальных сетей, такие как Facebook и Twitter, являются очень подходящими ресурсами для изучения людей; обновления статуса и твиты носят выразительный, личный и эмоциональный характер. Запомните несколько вещей:



  • Этот язык, как правило, беспристрастен и позволяет измерить поведенческие данные.
  • Язык Facebook, в частности, позволяет исследователям наблюдать за людьми, которые представляют свое истинное «я» онлайн-миру.

ДЛЯ метода

фигура 1

Как видно из рисунка 1 выше, DLA работает следующим образом: 1.) Извлечение функций: Извлечение языка: (а) слова и фразы : последовательность из 1–3 слов в строке текста, смайликов и двух или более слов, которые соответствуют некоторому обычному способу выражения. (б) темы : автоматический анализ больших коллекций немаркированного текста. 2.) Корреляционный анализ: процесс соотнесения слов с полом, возрастом и личностью. Поскольку они нашли тысячи существенно коррелированных слов, диаграммы визуализации стали ключом к пониманию их исследования (см. Рис. 2 ниже).

Очаровательно, правда?