ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №4. АВТОМАТИЗИРОВАННЫЙ ФОНОСЕМАНТИЧЕСКИЙ И КОНТЕНТ-АНАЛИЗ
Куликова Мария ЖМК-302
Были взяты две статьи одного автора, не совпадающие по тематике.
Первый текст:
"Золотая осень. Картина Поленова"
Второй текст:
"Ранний снег. О чем пишет Поленов"
"Золотая осень. Картина Поленова"
Второй текст:
"Ранний снег. О чем пишет Поленов"
Текст 2:
В первом тексте присутствуют негативные характеристики, практически отсутствуют положительные. Во втором же тексте похожая ситуация, только чаще положительные характеристики.
Это может быть связано с тем, что в первом тексте раскрывается тема живописи через картину "Золотая осень". Автор текста больше сравнивает картину с другими полотнами, но не дает конкретный анализ.
Второй текст, наоборот, рассказывает именно о содержании картины и деталях. Здесь больше описательных моментов.
Тексты схожи по тематике, но имеют разный посыл. Текст 1 воспринимается программой более негативно, поскольку в нём много критикующих сравнений. Текст 2 напротив - содержит большое количество слов, воспринимающихся позитивно, которые показывают симпатию автора.
Часть 2: Контент-анализ.
Текст 1:
Текст 2:
Модель текста довольно точно отражает содержание статей. Например, модель первого текста отразила основные ключевые слова "осень", "золотая", а вторая -- "снег", "Поленов".
Однако, на мой взгляд, облако слов точнее передаёт содержание текста, потому что выводит пользователю статистику по содержанию всех слов в тексте, а не основных, можно увидеть не только основные слова, но и то, что используется меньше.
Однако, на мой взгляд, облако слов точнее передаёт содержание текста, потому что выводит пользователю статистику по содержанию всех слов в тексте, а не основных, можно увидеть не только основные слова, но и то, что используется меньше.
Поэтому я считаю, что по методике word cloude легче определять тематику текстов, их содержание.
Комментарии
Отправить комментарий