№4. Автоматизированный фоносемантический и контент-анализ

Часть 1: Фоносемантический анализ

Для анализа были взяты тексты про влияние хорроров на человека. Первый текст научного формата, исследует влияние фильмов ужасов на человека. Второй текст представлен в виде любительской статьи (больше напоминающей пост в социальных сетях) про интерес геймеров к хоррор играм.

скриншот 1 текста

скриншот 2 текста

В анализе программы на скриншотах я вижу, что текст оценивается по разным эмоциональным категориям. В основном, баллы отрицательные в положительных аспектах: например, "хороший" -19 в первом тексте, а во втором -7, "красивый" в первом -19, -13 во втором, а "безопасный" -10 в первом, а во втором вообще до -23. Это значит, что звуки в тексте вызывают скорее негативные ассоциации, как будто тексты "звучат" мрачно и тревожно. Но в "плохих" категориях баллы высокие и положительные, особенно "отталкивающий" до 30, "страшный" до 23. Это логично для текстов про ужасы, потому что они полны страшных слов, которые подсознательно пугают или отталкивают.

В целом, программа показывает, как фонемы (звуки) влияют на эмоции: твердые звуки делают текст грубым и сильным, а это усиливает тему хоррора. Скриншоты незначительно отличаются числами, но общая картина одна — тексты эмоционально "темные" и интенсивные.

Часть 2: Контент-анализ

Для работы в программе Orange Biolab Si были взяты эти же тексты

Скриншоты 1 текста

Скриншоты 2 текста

Из word clouds видно, что Тексты хоть и про хоррор, но разные по фокусу: первый — серьёзный, о фильмах и их вреде/пользе для психики, слова вроде "фобии", "испытуемые", "хоррор" занимают центр, подчеркивая академический тон текста; второй — лёгкий, о играх как источнике адреналина и мемов, с современными трендами, что отражает неформальный стиль текста.

Word cloud точнее. Он напрямую показывает частоту слов, так что идеально отражает ключевые термины и тематику. Также он легче воспринимается: сразу видишь топ-слова в центре. Vaal сложнее: она абстрактная, фонетическая, требует интерпретации и не всегда интуитивна.

Ананина Виктория

Поиск по этому блогу

№4. Автоматизированный фоносемантический и контент-анализ