К основному контенту

№4. Автоматизированный фоносемантический и контент-анализ

Часть 1: Фоносемантический анализ

 Для анализа были взяты тексты про влияние хорроров на человека. Первый текст научного формата, исследует влияние фильмов ужасов на человека. Второй текст представлен в виде любительской статьи (больше напоминающей пост в социальных сетях) про интерес геймеров к хоррор играм.

скриншот 1 текста


 

скриншот 2 текста



В анализе программы на скриншотах я вижу, что текст оценивается по разным эмоциональным категориям. В основном, баллы отрицательные в положительных аспектах: например, "хороший" -19 в первом тексте, а во втором -7, "красивый" в первом -19,  -13 во втором, а "безопасный" -10 в первом, а во втором вообще до -23. Это значит, что звуки в тексте вызывают скорее негативные ассоциации, как будто тексты "звучат" мрачно и тревожно. Но в "плохих" категориях баллы высокие и положительные, особенно "отталкивающий" до 30, "страшный" до 23. Это логично для текстов про ужасы, потому что они полны страшных слов, которые подсознательно пугают или отталкивают.


В целом, программа показывает, как фонемы (звуки) влияют на эмоции: твердые звуки делают текст грубым и сильным, а это усиливает тему хоррора. Скриншоты незначительно отличаются числами, но общая картина одна — тексты эмоционально "темные" и интенсивные. 


Часть 2: Контент-анализ

Для работы в программе Orange Biolab Si были взяты эти же тексты


Скриншоты 1 текста






Скриншоты 2 текста






Из word clouds видно, что Тексты хоть и про хоррор, но разные по фокусу: первый — серьёзный, о фильмах и их вреде/пользе для психики, слова вроде "фобии", "испытуемые", "хоррор" занимают центр, подчеркивая академический тон текста; второй — лёгкий, о играх как источнике адреналина и мемов, с современными трендами, что отражает неформальный стиль текста.

Word cloud точнее. Он напрямую показывает частоту слов, так что идеально отражает ключевые термины и тематику. Также он легче воспринимается: сразу видишь топ-слова в центре. Vaal сложнее: она абстрактная, фонетическая, требует интерпретации и не всегда интуитивна.