Вы когда-нибудь задумывались о языке, используемом в социальных сетях? Или работа, которую мы используем, основана на наших личностных качествах? Если ваш ответ утвердительный, вам повезло.
В Центр позитивной психологии на базе Пенсильванского университета создали то, что известно как Проект мирового благополучия (WWBP). Этот удивительный проект разрабатывает научные методы измерения психологического благополучия и физического здоровья на основе анализа языка в социальных сетях. Лучшие специалисты по информатике, психологи и статистики вместе обсуждают психосоциальные процессы, влияющие на здоровье и счастье, и изучают возможности замены дорогостоящих методов обследований. В 2013 году WWBP опубликовал изучение под названием «Личность, пол и возраст на языке социальных сетей: подход открытого словарного запаса». В одном из крупнейших на сегодняшний день исследований WWBP проанализировал более 700 миллионов слов, фраз и тематических примеров, собранных из сообщений Facebook 75 000 добровольцев. Чтобы проанализировать сообщения, они использовали два разных метода для поиска демографических и психологических атрибутов:
В этом конкретном исследовании WWBP также попросил добровольцев пройти стандартные личностные тесты (модель «Большой 5 факторов») для определения слов, используемых в определенных личностных качествах. Объедините все это, и они смогли связать язык социальных сетей с личностью, полом и возрастом с точностью 91,9%. Теперь давайте запачкаем руки и посмотрим, как они собирали обновления статуса Facebook и составляли свои диаграммы визуализации.
Полный набор данных состоял примерно из 19 миллионов обновлений статуса Facebook, написанных всеми участниками. Команда WWBP ограничила свой анализ теми пользователями Facebook, которые соответствуют 4 определенным критериям:
Особенности женского языка показаны вверху, а особенности мужского языка - ниже. S размер слова указывает на силу корреляции; в Цвет указывает относительную частоту использования. Подчеркивание (_) соединять слова из многословных фраз.
Как вы можете видеть на Рисунке 3 выше, есть небольшие изменения тем, переходящие от одной возрастной группы к другой. Кроме того, есть четкие различия в словах, таких как использование сленга, смайликов и интернет-разговоров в От 13 до 18 лет . в От 23 до 29 лет , вы можете увидеть пару Интернет говорят или рабочие темы (например, «на работе», «новая работа»). Мы видим школа связанная тема для От 13 до 18 лет (например, «школа», «домашнее задание», «тьфу»), когда мы видим колледж связанная тема для От 19 до 22 лет (например, «семестр», «колледж», «регистр»). По мере продвижения к От 30 до 65 лет используемые слова больше ориентированы на эмоциональную стабильность в отношениях с семьей и друзьями (например, «дочь», «мой сын», «мои дети» и «мои друзья из Facebook»). В целом, вы увидите прогрессию в школе, колледже, работе и семье, если посмотрите на основные темы во всех возрастных группах.
В Рис. 4A , график показывает относительную частоту наиболее избирательных тем для каждой возрастной группы в зависимости от возраста. Рис. 4B подкрепляет эту гипотезу, представляя аналогичную модель, основанную на других социальных темах. Рис. 4C показывает, что использование слова «мы» увеличивается после 22 лет, тогда как «я» уменьшается. Это определенно указывает на возрастающее значение дружбы и отношений с возрастом.
Исследователи выяснили, как совпадают наш язык и личность. Они проанализировали слова, используемые участниками, и систематизировали их в зависимости от личности каждого участника. Вот несколько слов о пяти личностных факторах:
В левом верхнем углу мы видим, что социально связанные категории, такие как партия темы становятся ключевой отличительной чертой для Экстраверты . Кроме того, результаты показывают, что Интроверты интересуются японскими СМИ (например, 'аниме', 'манга', 'Интернет' и смайлики в японском стиле: ˆ_ˆ). В левом нижнем углу Рисунка 5 показано, что люди Высокий невротизм часто упоминаемые фразы, такие как «надоело», «подавлен» и «ненавижу». В правом нижнем углу показан язык, связанный с эмоциональной стабильностью ( Низкий невротизм ). Низкий невротический люди писали о приятных социальных мероприятиях, которые способствуют гармонии или создают больший эмоциональный баланс, таких как «спорт», «отпуск», «пляж», «церковь», «команда» и время для семьи тема. На рисунке 6 ниже (внизу справа) люди, отображающие Низкая открытость используйте сокращенные слова при обновлении статуса (например, «2day», «ur», «every 1»). Люди, которые High Open (внизу слева) используйте творческие слова (например, «искусство», «вселенная», «музыка», «письмо» и «душа»). Вы можете не резонировать с этим, но Низкая сознательность люди (в центре слева) используют очень явные слова в своих обновлениях, тогда как Высокая сознательность люди (в центре слева) используют фразы (например, «работать», «готов к» и «великий день»). Как видите, платформы социальных сетей, такие как Facebook и Twitter, являются очень подходящими ресурсами для изучения людей; обновления статуса и твиты носят выразительный, личный и эмоциональный характер. Запомните несколько вещей:
фигура 1
Как видно из рисунка 1 выше, DLA работает следующим образом: 1.) Извлечение функций: Извлечение языка: (а) слова и фразы : последовательность из 1–3 слов в строке текста, смайликов и двух или более слов, которые соответствуют некоторому обычному способу выражения. (б) темы : автоматический анализ больших коллекций немаркированного текста. 2.) Корреляционный анализ: процесс соотнесения слов с полом, возрастом и личностью. Поскольку они нашли тысячи существенно коррелированных слов, диаграммы визуализации стали ключом к пониманию их исследования (см. Рис. 2 ниже).
Очаровательно, правда?